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Lời mở dầu 


I® 


LỜI MỞ ĐẦU 


Nội dung chù yếu của toàn bộ quyển sách này được biên soạn từ 
quyên “ Structured Computer Organization “ cùa tác giả Andrew s. 
Tanenbaum t an ban lan thứ 3 } và một sô tài liệu về phần cứng 
của máy tính như PC hardivare design guide v.v... ( các năm từ 97 
trở về sau ). Tựa đề của quyển sách này là “ Cấu trúc máy tính “ 
thay vì là “ Tổ chức máy tính có cấu trúc “ nhằm phù hợp với tên 
môn học thường gọi trong các .trường Đại học Kỹ thuật và Khoa học 
tự nhiên. Khái niệm về cấu trúc và tổ chức sẽ được tìm thấy thông 
qua nội dung L ùa các chương 1 và 2. 

Đổì tượng cùa quyển sách này thường là các sinh viên chuyên 
ngành Điện, Điện tử, Viễn thông, Tự động và Công nghệ thông 
tin. Tuy nhiên với cách trình bày dễ hiểu cùa tác giả ( An- 
drew s. Tanenbaum ), những ai đã có kiến thức về vi mạch số và đá 
biết qua một ngôn ngữ lập trình đều có thể đọc không mấy khó 
khàn. 

Như vậy sinh viên các trường Cao đẳng Kỹ thuật và học sinh 
các trường Trung học nghề thuộc các chuyên ngành kể trên đều có 
thể đọc và hiếu ‘dược. 

Câu hoi lớn nhất mà bạn đọc cần lưu ý trả lời sau khi đọc xong 
quyển sách này ià “ khi ta đưa một chương trình viết bằng hợp ngừ 
hoặc một ngôn ngữ cấp cao vào máy tính, máy tính sẽ làm những gì 
đế thực thi chương trình của chúng ta, nội dung chủ yếu của những 
công việc đó và chúng có giông nhau trên các loại máy tính khác 
nhau hay khống ? “ 

Quyển sách này trình bày các cấp máy của một máy_tính hiện 
nay bao gồm : cấp logic số, cấp vi lập trình, cấp máy qui ước, cấp 




Câu trúc Máy tính 


máy hệ điều hành và câp hợp ngữ trong các chương từ 3 đên 7. Câp 
ngôn ngữ cấp cao và trình biên dịch không thuộc phạm vi quyển 
sách này. Chương 1 là phần giới thiệu các câp máy và lịch sử phát 
triển của máy tính, chương 2 mô tả tổng quát tổ chức của các hệ 
máy tính. Riêng chương 8 đề cập đến loại máy có tập chỉ thị rút 
gọn RISC, không giông với hệ máy tính đã mô tả trong 7 chương 
đầu. 

Mặc dù đã có nhiều cô" gắng trong việc biên soạn nhưng chắc 
chắn sẽ tồn tại nhiều sai sót trong quyển sách này. Rất mong nhận 
được sự góp ý và phê bình của các bạn đọc. 
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Chương 1: Mở đầu 


1 



1 


Mổ ĐẦU 


Máy tính sô' ( digital Computer ) ià máy ( machine ) giải quyết 
các vâ'n đề cho con người bằng cách thực hiện các chỉ thị do con 
người cung cấp. Một chuỗi các chỉ thị mô tả cách thực hiện một 
công việc nào đó gọi là chương trình ( program ). Các mạch diện tứ 
của một máy tính số có thê nhận biết và thực thi trực tiếp một tập 
giới hạn các chỉ thị đơn giản. Tất cả các chương trình của máy phải 
được biến đổi sang tập các chỉ thị ( hay còn gọi là tập lệnh ) này 
trước khi chúng được thi hành. Các chỉ thị cơ bán ( hiếm khi phức 
tạp hơn ) là : 

Cộng 2 số. 

Kiểm tra một sô' xem có bằng 0 hay không. 

Di chuyển một mẫu dữ liệu từ một phần bộ nhớ của máy tính 
đến nơi khác. 

Các chỉ thị cơ bản của một máy tính sô' cũng đồng thời hình 
thành một ngôn ngữ có khả năng giúp con người liên lạc với máy 
tính. Một ngôn ngữ như vậy gọi là ngôn ngữ máy ( machine 
language ). Người thiết kế một máy tính mới phải quyết định 
những chỉ thị nào bao gồm trong ngôn ngữ máy của máy tính. 
Thông thường họ cố gắng tạo ra các chi thị cơ bản và đơn giản phù 
hợp với năng lực dự định của máy tính và các yêu cầu về hiệu suâ't 
nhằm giám độ phức tạp và giá thành của các mạch điện tử. Do bới 
hầu hết các ngôn ngữ máy đều đơn gián, con .người sử dụng chúng 
một cách khó khăn và buồn tẻ. 





B2 


Cấu trúc Máy tinh 


Vấn đề này có thể được giải quyết bằng 2 phương pháp chính, 
cả 2 đều bao gồm việc thiết kế một tập lệnh mới thích hợp cho con 
người sử dụng hơn tập lệnh máy cài đặt sẵn trong máy ( buit-in ). 
Các chỉ thị mới này cũng hình thành một ngôn ngữ mà ta sẽ gọi là 
L2 giống như các chỉ thị máy cài đặt sẵn trong máy hình thành 
một ngôn ngữ mà ta sẽ gọi ỉà Ll. Điểm khác nhau của hai phương 
pháp là cách máy tính thực thi các chương trình viết bằng L2. Máy 
tính xét cho cùng chỉ có thể thực thi trực tiếp các chương trình viét 
bằng ngôn ngữ máy, Ll. 

Một phương pháp thực thi chương trình viết bằng L2 là trước 
tiên thay thế mỗi một chỉ thị của chương trình bàng một chuỗi các 
chỉ thị tương đương trong Ll. Chương trình kết quá hoàn toàn bao 
gồm các chỉ thị của Ll. Máy tính sẽ thực thi chương trình mới cùa 
Ll thay vì thực thi chương trình cũ của L2. Kỷ thuật này được gọi 
là dịch ( translation ). 

Một phương pháp khác là viết một chương trình bằng Ll, 
chương trình này xem các chương trình viết bằng L2 như là dữ liệu 
ngõ vào và thực thi chúng bằng cách khảo sát tuần tự từng chỉ thị 
và thi hành trực tiếp chuỗi các chỉ thị tương đương trong Ll. Kỷ 
thuật này không yêu cầu tạo ra một chương trình mới trong Ll, 
được gọi là phiên dịch ( interpretation ) và chương trinh thực hiện 
sự phiên dịch gọi là trình phiên dịch ( interpreter ). 

Dịch và phiên dịch tương tự nhau. Trong cả 2 phương pháp, các 
chỉ thị trong L2 sau cùng được thi hành bằng cách thực thi các 
chuỗi chỉ thị tương đương trong Ll. Chứng khác nhau ớ chỗ, khi 
dịch, toàn bộ chương trình viết bằng L2 trước tiên được biến đổi 
thành một chương trình của Ll, chương trình viết bằng L2 được bỏ 
di và chương trình mới của LI được thực thi. Khi phiên dịch, sau 
khi mỗi một chỉ thị viết bằng L2 được khảo sát và giải mã, chỉ thị 
này sẽ được thực thi trực tiếp. Không có chương trình được dịch nào 
phát sinh. Cả 2 phương pháp trên đểu được sứ dụng rộng rái. 

Để tiện lợi hơn, thay vì nghĩ đến .dịch hay phiên dịch, ta có thể 
hình dung sự hiện hữu của một 'máy tính giả định ( hypothetical 
Computer ) hoặc máy ảo ( Virtual machine ) với ngôn ngữ máy L2. 
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Nêu một máy như vậy được chê tạo đủ rẻ, ta hoàn toàn không cần 
ngôn ngữ Ll hoặc máy thực thi chương trình viết bằng Ll. Một 
cách đơn giản, ta chỉ cần viết các chương trình bằng L2 và có máy 
tính thực thi chứng một cách trực tiếp. Ngay cả khi máy ảo với 
ngôn ngữ máy L2 quá đắt tiền dể chê tạo bằng các mạch điện tử, ta 
vân có thế viêt các chương trình trên máy này. Các chương trình 
này hoặc được phiên dịch hoặc được dịch bời một chương trình viết 
bằng Lt và tự chương trình này được thực thi trực tiếp bởi máy 
hiệu CÓ. Nói cách khác, ta có thể viết các chương trình cho các máy 
ủồ như thể chúng thực sự hiện hữu. 


Trong thực tế, để thực hiện dịch và phiên dịch, các ngôn ngữ LI 
và L2 không được khác nhau nhiều. Sự ràng buộc này thường có 
nghĩa là ngôn ngữ L2 mặc dù tốt hơn ngôn ngữ Ll, vần còn khá xa 
mới đạt đến lý tưởng cho hầu hết các ứng dụng. Kết quả này có lẽ 
làm nản lòng đối với mục đích ban đầu tạo ra L2, nhằm cất di gánh 
nặng cho người lập trình khỏi phải diễn đạt các giải thuật trong 
ngôn ngừ thích hợp với máy hơn là với con người. Tuy nhiên, tình 
huống này không phải là tuyệt vọng. / 


Giải pháp hiển nhiên là phát minh ra một tập các chỉ thị khác 
hướng về con người nhiều và ít hướng về máy hơn so với tập các chỉ 
thị của L2. Tập thứ ba này cũng hình thành một ngôn ngữ và ta gọi 
là L3. Ta có thể viết các chương trình trong L3 như thể có một máy 
ảo thật sự hiện hữu với L3 là ngôn ngữ máy của máy này. Các 
chương trình như vậy hoặc được dịch sang L2 hoặc dược thực thi bới 
một trình phiên dịch viết trong L2. 

Việc phát minh ra toàn bộ chuỗi các ngôn ngữ, mồi một ngôn 
ngữ thích hợp hơn so với ngôn ngữ trước đó, có thể tiếp tục không 
ngừng cho đến khi cuối cùng nhận được ngôn ngữ thích hợp nhất. 
Mỗi một ngôn ngữ sử dụng ngôn ngữ trước đó làm nền tảng nên ta 
có thể xem một máy tính sử dụng kỹ thuật này như là một chuỗi 
các lớp { layer ) hay cấp ( level ), cấp này ở trên cấp kia như trong 
hình 1.1. Ngôn ngừ hoặc cấp thấp nhất sẽ dơn giản nhât và ngôn 
ngữ hoặc cáp cao nhất sẽ phức tạp nhât. 







Cáp n 
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Cấp 4 


Cấp 3 


Cấp 2 


Cấp 1 



Các chương tilnh trong Ln 
hoặc dược phiên dịch bỡi 1 
trình phiên dịch chạy trẽn 
máy thấp hơn hoặc được 
dịch thành ngôn ngữ máy 
cua máy câp tháp hơn 


Các chương trình trong L3 
hoặc được phiên dịch bới 1 
trình phiên dịch chạy trên 
M2 hay MI hoặc được dịch 
thảnh L2 hay Ll, 

Các chương trình trong L2 
hoặc dược phiên dịch bới 1 
trình phiên dịch chạy trèn 
MI hoặc dược dịch thành LI 

Các chương trình trong LI 
dược thi hành trực tiếp bới 
các mạch điện tử 


Hình 1.1 Một máy n cáp 


1.1 NGÔN NGỮ, CẤP MÁY VÀ MÁY Ảo 

Giữa ngôn ngữ và máy áo có một môi liên hệ quan trọng. Mỗi 
một máy có một ngôn ngữ máy bao gồm tất cả các chỉ thị mà máy 
có thể thực thi. Một máy xác định một ngôn ngừ. Tương tự một 
ngôn ngữ xác định một máy, máy thực thi được tất cả các chương 
* trình viết bằng ngôn ngữ này. Dĩ nhiên máy được xác định bơi một 
ngôn ngừ nào đó có thể quá phức tạp và quá đắt để xây dựng trực 
tiếp bàng các mạch điện tử, tuy vậy ta có thề tường tượng được. 
Một máy với c, Pascal hoặc Cobol là ngôn ngữ máy sẽ thật sự phức 
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tạp nhưng chãc chăn có thê nhận biêt được và có lẽ trong tương lai 
một máy như vậy sè được khảo sát dễ dàng để thiết kế. 

Mọt may tính có 11 câp được xem như lĩ máy áo khác nhau, mỗi 
máy ảo có một ngôn ngữ máy riềng. Các thuật ngữ “cấp” và “máy 
ảo” có thể dùng thay thế cho nhau. Chỉ có các chương trình viết 
bang ngon ngư Líl mơi được thực hiện trực tiêp bởi các mach điện 
tử mà không cần sự can thiệp của dịch hoặc phiên dịch. Các chương 
trinh viêt băng L2, L3, ... , Ln hoặc phải được phiên dịch bới một 
trình phiên dịch chạy trên cấp thấp hơn hoặc phải được dịch sang 
ngôn ngữ khác tương ứng với cấp tháp hơn. 


Một người viêt các chương trình cho máy áo cấp 11 không cần 
biết các trình phiên dịch và dịch này. Câu trúc máy đám bảo các 
chương trình này sẽ dược thực thi bàng cách này hoặc bằng cách 
khác. Hoặc chúng được thực thi từng chi thị một bởi một trình 
phiên dịch, rồi đến lượt trình phiên dịch này được thực thi bới một 
trình phiên dịch khác, hoặc chúng được thực thi trực tiếp bới các 
mạch điện tử. Kết quả là trong cá 2 trường hợp, các chương trình 
đều được thực thi. 


Hầu hết các lập trình viên sử dụng máy 11 cấp chỉ quan tâm đến 
cấp cao nhât, ít người quan tâm đến ngôn ngữ ờ câp thấp nhất. Tuy 
nhiên, những ai cần tìm hiểu cách thức một máy tính làm việc thực 
sự dều phải nghiên cứu tất cả các cấp. Những người quan tâm đến 
việc thiết kế các máy tính mới hoặc các cấp mới cũng phái lầm 
duen với các cấp máy khác ngoài câp cao nhất. Các khái niệm và 
kỹ thuật xây dựng các máy như là một chuỗi các cấp và chi tiết của 
một sô cấp quan trọng tạo thành chủ đề chính của quyển sách này. 
Máy tính được xem xét như là một hệ thông các cấp có thứ bậc cho 
ta một cấu trúc hoặc một cơ cấu tô chức tốt nhằm tìm hiểu cách tô 
chức các máy tính. Hơn nữa, việc thiết kế một hệ thông máy tính 
như là một chuỗi các câp giúp ta đảm báo được thành quá sẽ có cấu 
trúc tốt. 

1.2 MÁY NHIỀU CẤP 

Hầu hết các máy tính hiện nay bao gồm 2 hay nhiều cấp. Thông 
thường các máy có 6 cấp hay hơn như trong hình 1.2. 










(MỊ 6 
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Cấp 5 


Cấp 4 


Cấp 3 


Cấp 2 


Cấp 1 


Cấp 0 



Hình 1.2 Sáu cấp trên các máy tính hiện nay. Phương pháp hỗ trợ cho mỗi 
cấp chỉ ra ở phía dưới cấp, cùng với tên của chương trình hỗ trợ trong dấu 

ngoặc đơn. 

Cấp 0, ở đáy của hình vẽ, thật sự là phần cứng của máy. Các 
mạch điện tử của cấp này thực thi các chương trình ngôn ngữ máy 
của cấp 1. Để được hoàn chỉnh, ta cũng cần bàn đến một cấp khác 
dưới cấp 0. Cấp này không được vẽ trong hình 1.2 do bởi thuộc lĩnh 
vực kỹ thuật điện không nằm trong phạm vi quyến sách này. Ta gọi 
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câp này là câp linh kiện ( device level ). Các nhà thiết kế tìm thấy 
ớ cấp này các transistor riêng rè, chúng là các thành phần có cấp 
thâp nhất đôi với các nhà thiết kế máy tính ( dĩ nhiên có người sẽ 
hỏi các transistor làm việc ra sao, nhưng điều này thuộc lĩnh vực 
vật lý chất rắn ). 

ơ cấp tháp nhât chúng ta khảo sát, cấp logic số ( digital logic 
level ), đôi tượng được quan tâm là cổng logic ( logic gate ). Mặc dù 
được xây dựng từ các thành phần tương dồng ( analog component ) 
như là các transistor, các cổng mô hình hóa một cách chính xác các 
linh kiện sô ( digital device ). Mồi một cống có một hoặc nhiều ngõ 
vào sô ( các tín hiệu biểu diễn bởi 0 hoặc 1 ) và ngỏ ra là hàm đơn 
giản cùa các ngõ vào này. Các cổng được xây dựng tôi đa từ một 
nhóm nhỏ các transistor. Cấp logic sô" dược khảo sát chi tiết ò' 
chương 3. Dù rằng kiến thức về cấp linh kiện là kiến thức mang 
tính chuyên sâu, nhưng với sự ra đời của các bộ vi xứ lý và các máy 
vi tính, ngày càng có nhiều người tiếp xúc với cấp logic sô*. Từ lý do 
này, ta dành trọn một chương để đề cập đến chúng. 

Cấp trên kế tiếp là cấp 1, cấp ngôn ngữ máy thật sự. Trái 
ngược với câ*p 0, ở đó không có khái niệm một chương trình là một 
chuỗi các chỉ thị được thực thi, ớ câ*p 1 có một chương trình gọi là vi 
chương trình ( microprogram ) làm nhiệm vụ phiên dịch các chỉ thị 
của câp 2. Chúng ta gọi cấp 1 là cấp vi lập trình ( micro- 
programming level ). Mặc dù không có 2 máy tính có các câ'p vi lập 
trình hoàn toàn như nhau, sự tương đồng của chúng dủ cho phép ta 
rút ra các đặc trưng cần thiết và thảo luận về cảp này như thế đây 
là cấp được định nghĩa đầy đủ. Một vài máy có nhiều hơn 20 chi thị 
ở cã*p này và hầu hết là các chi thị di chuyển dữ liệu từ phần này 
đến phần khác cúa máy, hoặc thực hiện một số việc kiểm tra đơn 
giản. 

Mỗi một máy cấp 1 có một hoặc nhiều vi chương trình chạy 
trên chúng. Mỗi một vi chương trình xác định hoàn toàn một ngôn 
ngữ cáp 2 ( hoặc một máy áo với ngôn ngữ máy là ngôn ngữ cấp 2 
này ). Các máy cấp 2 cũng có nhiều điểm chung, thậm chí các máy 
cấp 2 của các hãng khác nhau cũng có nhiều điểm tương đồng hơn 
là khác biệt. Trong quyển sách này chúng ta gọi cấp này là cấp 
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máy qui ước ( conventional machỉne level ) do không có một tên gọi 
tống quát. 

Các nhà sản xuất máy tính đều cho xuất bản các quyền sô tay 
kèm theo các máy tính họ bán ra. Các quyển sổ tay này thường có 
tựa đề “ sô’ tay tham khảo ngôn ngữ máy ” ( machine language 
reterence manual ) hoặc “ các nguyên tắc hoạt động cùa máy tính 
Western Wombat kiểu 100X “ ( principles of operation of the 
Western Wombat model 100X J hoặc các tựa dề tương tự. Các quyến 
sỏ tay này nói về máy ảo câp 2, không phái máy thực cáp 1. Tập 
các chi thị của máy được mỏ tả là các chỉ thị được thực thi bằng 
cách phiên dịch bởi vi chương trình, không phái các chi thị được 
thực thi trực tiếp bơi phần cứng. Nếu một nhà sản xuất máy tính 
cung cấp 2 trình phiên dịch cho một máy nhằm phiên dịch 2 ngôn 
ngữ máy cấp 2 khác nhau, nhà sản xuất này cần cung cấp 2 loại số 
tay tham khảo ngôn ngữ máy ứng với 2 trình phiên dịch. 

Cũng cần lưu ý, một số máy tính không có cấp vi lập trình. 
Trên các máy này, các chỉ thị của cấp máy qui ước dược thực thi 
trực tiếp bới các mạch điện tứ ( cấp 0 ), không có trình phiên dịch 
của máy cấp 1, kết quá cấp 1 ( không phải cấp 2 ) là cấp máy qui 
ước. Tuy nhiên ta vần gọi cấp 2 là cấp máy qui ước bất chấp các 
ngoại lệ này. 

Cấp thứ ba thường là câp hỗn hợp { hybrid level ). Hầu hết các' 
chỉ thị trong ngôn ngừ của câp máy này cũng ở trong ngôn ngữ cấp 
2 ( không có lý do tại sao một chì thị xuất hiện ở một cấp này lại 
không thể hiện diện ớ các câp khác ). Thêm vào đó lại có một tập 
các chỉ thị mới, một tố chức bộ nhớ khác, khả năng chạy 2 hay 
nhiều chương trình song song và nhiều đặc trưng khác. Sự thay đổi 
hiện hữu nhiều giữa các máy cấp 3 hơn là giữa các máy câp 1 hay 
câp 2. 

Các tiện nghi mới thêm vào ớ cấp 3 được thực thi bới một trình 
phiên dịch chạy trên cấp 2, gọi là hệ điều hành (operating System). 
Nhiều'chi thị cấp 3 khác, giống như các chi thị cấp 2 được thực thi 
trực tiếp bời vi chương trình, không phái bới hệ diều hành. Nói 
cách khác, một Số chí thị cấp 3 được phiên dịch bới hệ điều hành 
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và một sô chỉ thị câp 3 được phiên dịch trực tiếp bời vi chương 
trình, do vậy ta gọi là câp hồn hợp. Chúng ta gọi cấp này là cấp 
máy hệ điều hành ( operating System machine level ). 

Có một bước ngoặt cơ bán giữa câp 3 và cấp 4. Ba cấp thấp 
nhât không được thiêt kê đé sứ dụng trực tiẻp bời những người lập 
trình thông thường mà được dự định chu yếu đế chạy các trình dịch 
và trinh phiên dịch cần hỗ trợ cho các cấp cao hơn. Các trình dịch 
và trình phiên dịch được viết bới các lặp trình viên hệ thông 
( System programmer ), những người chuyên thiết kê và hiện thực 
các máy ảo mới. Câp 4 và các cáp trên nửa được dự định dành cho 
những người lập trình ứng dụng ( applications programmer ) nhằm 
giải quyết một vấn đề nào đó. 

Một thay đổi khác xuất hiện ớ cấp 4, đó là phương pháp hỗ trợ 
cho các cấp cao hơn. Các cấp 2 và 3 luôn luôn được phiên dịch. Các 
cấp 4, 5 và cao hơn thông thường, nhưng không phải luôn luôn, 
được hỗ trợ bới dịch. 

Sự khác nhau khác nữa giữa các cấp 1, 2 và 3 trên mặt này và 
các cấp 4, 5 và cao hơn trên mặt khác là bản chất cúa ngôn ngữ 
được cung cấp. Các ngôn ngữ máy ớ các câp 1, 2 và 3 có dạng sô. 
Chương trình trong các ngôn ngữ này bao gồm những chuỗi dài các 
sô', chúng tốt với máy nhưng xấu đối với người. Bắt đầu từ câp 4, 
ngôn ngữ chứa các từ và các chữ viết tắt mang ý nghĩa đối với con 

người. 

Cấp 4, cấp ngón ngữ hợp dịch hay cáp hợp ngữ ( assembly 
language level ) thật sự là dạng tượng trưng cho một trong các ngôn 
ngừ. Cấp này cung cấp một phương pháp viết các chương trình cho 
các cấp 1, 2 và 3 dưới dạng không gây khó chịu như chính các ngôn 
ngữ máy của chúng. Các chương trình viết bằng hợp ngữ trước-tiên 
được dịch sang ngôn ngữ của cấp 1, 2 hoặc 3, sau đó được phiên 
dich bơi máy ảo hoặc thực tương ứng. Chương trình thực hiện việc 
dịch gọi là trình dịch hợp ngữ ( assembler ). 

Cấp 5 bao gồm các ngôn ngữ được thiết kế dành cho những 
người lập trình ứng dụng nhằm giái quyết các vấn đề nào đó. Các 
ngôn ngữ này gọi là các ngôn ngữ cấp cao ( high level language ). 
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Theo nghĩa đen có vài trăm ngôn ngữ khác nhau. Một vài ngôn ngữ 
nối tiếng là BASIC, c, COBOL, FORTRAN, LISP, Mođula 2 và 
PASCAL và các ngôn ngừ lập trình hướng đôi tượng ( object- 
oriented programming language ) sau này như C++, J++, v.v... . 

Các chương trình được viết bằng các ngôn ngữ này thường được 
dịch* sang cấp 3 hoặc cấp 4 bằng các trình dịch gọi là trình biên 
dịch ( compiler ) dù rằng đôi khi chúng cũng được phiên dịch. 

Cấp 6 và các cấp trên nừa bao gồm những tập hợp các chương 
trình được thiết kê đề tạo ra các máy dành riêng cho các ứng dụng 
đặc biệt. Chúng chứa một lượng lớn thông tin về các ứng dụng đó. 
Có thê tướng tượng ra các máy áo dành cho các ứng dụng trong 
quán lý, giáo dục, thiết kế máy tính, v.v... . Các cấp này là lĩnh vực 
đang được nghiên cứu. 

Tóm lại, vấn đề chính cần nhớ là các máy tính được thiết kế 
thành một chuỗi các câ'p, mỗi một câ'p được xáy dựng trên cấp trước 
đó. Mỗi cấp biểu thị một quan điểm trừu tượng riêng, với các đôi 
tượng và các thao tác khác nhau. Bằng cách thiết kế và phân tích 
máy tính theo cách này, chúng ta tạm thời bỏ qua các chi tiết 
không thích hợp và do vậy làm cho một vấn đề phức tạp được hiểu 
dễ dàng hơn. 

Tập các loại dữ liệu, các thao tác và các đặc trưng của một cấp 
được gọi là cấu trúc ( architecture ) của.cấp đó. Cấu trúc xử lý các 
khía cạnh nhìn thây được đối với người sử dụng cấp đó. Các đặc 
trưng người lập trình thấy được như có bao nhiêu bộ nhớ có giá trị 
ĩà một phần của cấu trúc. Các khía cạnh thực hiện ( implemen- 
tation aspect ) như loại công nghệ chip nào được sử dụng đế thực 
hiện bộ nhớ không phái là một phần của cấu trúc. 

vỉệc nghiên cứu cách thiết kế các phần cùa một hệ thông máy 
tính mà người lập trình nhìn thấy được gọi ỉà càu trúc máy tính. 
Trong thực tế, cấu trúc máy tính ( Computer architecture ) và tổ 
chức máy tính ( Computer organisation ) về bản chất muôn nói đến 
cùng một sự việc. 





Chương 1: Mỏ' đầu 



1.3 Sự PHÁT TRIỂN CỦA MÁY NHIẺU CÂP 

Phẩn này khảo sát tóm tắt lịch sứ phát triển cũa máy nhiều 
cấp. Các máy tính đầu tiên vào những thập niên 40 chi có 2 câp : 
câp máy qui ước và cấp logic số. Toàn bộ việc lập trinh được thực 
hiện trên câp máy qui ước và các chương trình được thực thi trên 
cấp logic sô. Các mạch điện của câp logic sô phức tạp, khó hiếu, 
khó xây dựng và thiêu tin cậy. 


Nãm 1951 ớ Anh, M.V.Wikes đề nghị ý tuớng thiết kế một máy 
tính 3 cấp để đơn giản tôi đa phần cứng. Máy này có một trình 
phiên dịch cài đặt sán, không thay đối, có nhiệm vụ thực thi các 
chương trình ngôn ngữ máy qui ước bằng cách phiên dịch. Bời vì 
phần cứng bây giờ chí phái thực thi các vi chương trình với số chi 
thị giới hạn thay vì thực thi các chương trình ngôn ngữ máy qui ước 
với số chỉ thị lớn hơn nhiều, các mạch điện tứ cần có cùng ít hơn, 


Vào thời này các mạch điện tử được thiết kế dựa trên các đèn 
điện từ, sự đơn giản hóa phần cứng đám bảo giảm scí lượng đèn và 
do vậy làm tăng độ tin cậy. Một vài máy 3 cấp đâ được chế tạo 
trong suốt những năm 50 và nhiều máy hơn được chế tạo trong suốt 
những năm 60. Vào năm 1970, ý tướng có cấp máy qui ước dược 
phiên dịch bởi một vi chương trình, thay vì thực thi trực tiếp bới 
phần cứng, đã phát triển rộng rãi. 

Trình dịch hợp ngữ ( assembler ) và các trình biên dịch ngôn 
ngữ cấp cao { compiler ) phát triển trong những nãm 50 tạo dễ dàng 
cho công việc của người lập trình. Vào những năm này, hầu hết các 
máy tính là “ cửa hàng mở ” ( open shop ), nghĩa là người lập trình 
phải tự điều hành máy. Cạnh bên mỗi máy có một giấy đãng ký. 
Một lập trình viên muốn chạy một chương trình phải đăng ký 
khoảng thời gian, thí dụ ngày thứ tư từ 3 giờ đến 5 giờ sáng 
( nhiều lập trình viên thích làm việc trong phòng máy lúc yên 
tĩnh ). Khi đến giờ, người lập trình hướng về phòng máy với một 
hộp thẻ trong một tay và cây viết chì nhọn trong tay kia. Lúc vào 
phòng máy, người này đánh nhẹ bằng khuy tay vào người trước về 
phía cửa và chiếm lấy máy tính. 
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Nếu người này muôn chạy một chương trình FORTRAN, ỏng ta 
phái qua các bước sau : 

1. Đi qua một phòng riêng nơi cát giữ thư viện chương trình, 
lây ra một hộp xanh lớn đề nhân trình biên dịch FORTRAN 
rồi đặt vào trong đầu đọc thẻ, ấn nút khới động. 

2. Đặt chương trình FORTRAN cúa ông ta vào đầu đọc thẻ và 
ấn nút tiếp tục. Chương trình được đọc vào. 

3. Khi máy tính dừng, ông ta đọc chương trình FORTRAN của 
mình lần thứ hai. Mặc dù một số trình biên dịch chi yêu cầu 
1 bước khi đọc vào, cũng có khi cần 2 hay nhiều bước. Với 
mỗi một bước, hộp thẻ lớn được đọc vào. 

4. Cuôu cùng việc dịch hầu .như hoàn tất. Lập trình viên 
thường trở nên căng thắng vào lúc gần cuõi vì nếu trình 
biên dịch tìm thấy một lồi trong chương trình của ông ta, 
ông ta phái sửa lỗi và tất cá phái bát dầu lại từ đầu. Nếu 
không có lỗi, trình biên dịch sẽ đục lỏ chương trình ngôn 
ngữ máy đã dịch lên trên các thẻ. 

5. Tiếp đến người lập trình đưa chương trình ngôn ngữ máy 
vào đầu đọc thẻ cùng với hộp thư viện chương trình con và 
đọc cả hai. 

6. Chương trình bắt đầu dược thực thi. Thường chương trình ít 
khi không chạy hoặc dừng thình lình giữa chừng. Người lập 
trình thường đùa nghịch với các chuyến mạch điều khiến và 
quan sát các đèn điều khiển trong khi chờ. Nếu may mắn, 
ông ta hiểu ra vân đề, sửa lỗi và quay về phòng riêng chứa 
trình biên dịch FORTRAN và bắt đầu lại lần nữa. Nếu kém 
may mắn, ỏng ta in bộ nhớ và mang về nhà nghiên cứu. 

Thủ tục này, với những thay đổi nhỏ, xảy ra bình thường ở các 
trung tâm máy tính trong nhiều năm. Thu tục này buộc các lập 
trình viên phải học cách điều hành máy và biết phải làm gì khi 
máy không tiếp tục được. Máy thường rảnh còn con người phải 
mang các thé di khắp phòng hoặc gãi đầu cố tìm ra lý do tại sao 
chương trình cùa họ không hoạt dộng như cách họ suy nghĩ. 





Chương 1: Mở đầu 
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Vào nãm 1960, con người đã cỏ gắng giảm thiểu lượng thời gian 
bỏ phí bằng cách tự động hóa công việc điều hành. Một chương 
trình được gọi là hệ điều hành ( operating System ) luôn luôn được 
lưu giữ bên trong máy tính. Lập trình viên cung cấp một sô thẻ 
điều khiên cùng với chương trình, chúng được đọc và thực thi bởi hệ 
điều hành. Hình 1.3 trình bày một hộp mầu cua một trong các hệ 
điều hành phát triển rộng rãi đáu tiên, FMS ( KORTRAN monitor 
System ), sử dụng trên IBM 709. 


*JOB , 5494 , SUZANNE BAART 
•XEQ 

•FORTRAN 




FORTRAN 

program 


V 

•DATA 




Data < 
cards 




•END 


Hình 1.3 Một cùng việc mẫu cúa hệ điều hành FMS 

Portran program : chương trình Portran 
Data cards : các the dữ liệu 

Hệ điều hành dọc thẻ *JOB và dùng thông tin trên thẻ này cho 
các mục đích tính toán ( dấu * dùng để nhận dạng các thẻ điều 
khiển nhằm tránh nhầm lẫn với các thẻ dữ liệu và chương trình ). 
Sau đó hẹ điều hành đọc thẻ *FORTRAN để nạp trình biên dịch 
FORTRAN từ băng từ. Kế đến trình biên dịch dọc vào và biên dịch 
chương trình viết bằng FORTRAN. Khi trình biên dịch hoàn tất, 
trình này trả điều khiển lại cho hệ điều hành đế dọc thẻ :i: DATA. 
Đảy là chi thị thực thi chương trình đã biên dịch sứ dụng các thẻ 
tiếp theo thé *DATA như là các dữ liệu. 
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Mặc dù hệ điều hành đả được thiết kẽ đế tự động hóa công việc 
điều hành, đây cũng chỉ ỉà bước đầu tiên trong quá trinh phát triển 
một máy ảo mới. Thẻ *FORTRAN được xem như chỉ thị áo biên 
dịch chương trình. Tương tự, thẻ :!: DATA là chi thị áo thực thi 
chương trình. Một cấp chi có 2 chi thị là quá ít, nhưng dây là bước 
khới đầu theo hướng này. 

Trong nhiều năm tiếp theo sau, các hệ điều hành trớ nên ngày 
càng phức tạp. Các chi thị, các tiện nghi và các đặc trưng mới được 
thêm vào cáp máy qui ước cho dến khi bất đầu xuât hiện một cấp 
mới. Một sô chi thị cua cấp mới này gióng với các chi thị cua cấp 
máy qui ước nhưng một sỏ khác, đặc biệt là các chi thị xuất / nhập 
lại hoàn toàn khác. Các chỉ thị mới thường được biết đến như là các 
macro hệ điều hành hoặc các lời gọi máy chú ( supervisor ). 

Cũng có hệ điều hành phát triển theo cách khác. Các hệ điều 
hành sớm nhất đọc các hộp the và in kết quá trên máy in. Tố chức 
này được gọi là hệ thống nhóm chi thị { batch System ). Luôn luôn 
có thời gian chờ khoáng vài giờ giừa thời gian một chương trình bị 
ràng buộc và thời gian các kết qúá đã sẵn sàng. Sự phát triển phần 
mềm sẽ khó khăn trong các tình huông này. 

Vào những năm đầu cua thập niên 60, các nghiên cứu ở đại học 
Dartmouth, MIT và các nơi khác đã phát triển các hệ điều hành 
cho phép những người lập trình truyền thông trực tiếp với máy 
tính. Trong các hệ thống này, các thiết bị đầu cuô'i từ xa dược nối 
với máy tính trung tâm qua các đường điện thoại. Một lập trình 
viên có thể gõ vào một chương trình vả nhận kết quá trả về gần 
như tức thời ngay tại văn phòng riêng hoặc trong nhà xe ở nhà 
hoặc bất cứ nơi nào có đặt. thiết bị đầu cuối. Các hệ thông này đươc 
gọi là các hệ thống chia xẻ thời gian ( time-sharing System ). 

Trong hệ điều hành, ta quan tám đến các phần phiên dịch các 
chỉ thị và các đặc trưng hiện diện trong cấp 3 nhưng không hiện 
diện trong cấp 2 hơn là quan tám đến các khía cạnh chia xẻ thời 
gian. Mặc dù không nhấn mạnh đến điều sau đáy, nhưng cần ghi 
nhớ các hệ diều hành làm được nhiều việc ngoài việc phiên dịch. 




Chương 1: Mó' đầu 
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1.4 PHẦN CỨNG, PHẨN MEM và máy nhiêu CẢP 

Các chương trình viết bằng ngôn ngữ máy của máy tính { ngôn 
ngữ câp 1 ) được thi hành trực tiếp bởi các mạch điện tứ của máy 
tính ( câp 0 ), không có trình phiên dịch hoặc trình dịch nào xen 
vào. Các mạch điện tứ cùng với bộ nhớ và các thành phần xuât / 
nhập tạo nên phần cứng của máy tính. Phần cứng bao gồm các đối 
tượng hữư hình - các mạch tích hợp, các board mạch in, các cáp, các 
nguồn câp điện, các bộ nhớ, các đầu đọc thẻ, các máy in và các 
thiết bị đầu cuôi - khác với các ý tường trừu tượng, các giải thuật và 
các chi thị. 

Phần mềm, trái lại, bao gồm các giái thuật í algorithm )( các 
chi thị chi tiết cho biẽt cách làm một điều gì dó ) và các biêu diễn 
trên máy tính cua giải thuật này gọi là các chương trình. Các 
chương trình dược biểu thị trên các thẻ đục lỗ, băng từ, phim hình 
và các phương tiện khác nhưng điều chu yếu cúa phần mềm là tập 
các chi thị cấu thành các chương trình, không phải các phương tiện 
vật lý mà trên đó chúng được ghi. 

Một dạng trung gian giừa phẩn mềm và phần cứng gọi là 
firmware, bao gồm phần mềm được đặt vào bên trong các thành 
phần điện tử trong thời gian sản xuất chúng. Firmware được dùng 
khi chương trình chắc chắn hiếm khi hoặc không bao giờ thay đổi, 
thí dụ chương trình điều khiển đặt trong ROM của các đồ chơi hay 
các thiết bị. Finnwarc cùng dược dùng khi các chương trình cần 
thiết luôn luôn tồn tại dù không còn cấp điện ( thí dụ khi nguồn pin 
của búp bê được lấy ra ). Trong nhiều máy tính, vi chương trình tổn 
tại ở dạng finnware. 

Chú đề trung tâm của quyến sách này sẽ xuất hiện mãi mãi là : 

Phần cứng và phần mềm tương đương với nhau về mặt logic 
( hardiưare and software are logicalỉy cquivalent ) 

Một thao tác bất kỳ được thực hiện bởi phần mềm cũng có thế 
được gắn trực tiếp vào phần cứng ( nghĩa là cũng được thực hiện bơi 
phần cứng ) và một chỉ thị bất kỳ được thực thi bởi phần cứng cũng 
có thể được mô phỏng bằng phần mềm. Quyết định đặt một sô' chức 
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năng này vào phần cứng và các chức năng khác vào phần mềm dựa 
trẽn các yếu tô như giá thành, tốc độ, độ tin cậy và tần số cua các 
thay đối được kỳ vọng. Không có những qui luật cứng ngắc chi phôi 
rằng X phải đưa vào phần cứng và Y phái được lập trình một cách 
rõ ràng. Các nhà thiết kế với những mục đích khác nhau thường 
đưa ra những quyết định khác nhau. 

Trên rãt nhiều máy tính đầu tiên, phần cứng và phần mềm 
được phân biệt rõ ràng. Phần cứng thực hiện một vài chi thị đơn 
giản như cộng { ADD ) và nháy ( JƯMP ), còn mọi thứ khác được 
lập trình một cách tường minh. Nếu một chương trình cần nhân 2 
số với nhau, người lập trình phái tự viết thú tục nhãn hoặc mượn 
thù tục này từ thư viện. Theo dòng thời gian, một sỏ thao tác 
thường xuyên thực hiện chứng tó rằng việc xây dựng các mạch 
phần cứng đặc biệt nhằm thực thi chúng một cách trực tiếp { thực 
thi nhanh hơn ) là điều hiến nhiên đôi với các nhà thiết kế. Kết 
quá này hình thành một xu hướng di chuyến các thao tác theo 
hướng từ trên xu ỏng, đến cấp thấp hơn. Có thao tác trước đáy dược 
lập trình ớ cấp máy qui ước, sau dó được tìm thấy trong phần cứng. 

Với sự ra đời của thế hệ máy tính dùng vi lập trình và có nhiều 
cấp, xu hướng ngược lại cũng được bộc lộ ra. Trong các máy tính ra 
đời sớm nhất, rõ ràng chỉ thị ADD được thực hiện trực tiếp bới 
phần cứng. Trẽn một máy tính được vi lập trình hóa, chỉ thị ADD 
cúa cấp máy qui ước được phiên dịch bơi một vi chương trình chạy 
trên cấp thâp nhất và được thực thi như là một chuỗi các bước nhỏ : 
tìm-nạp chi thị, xác định loại chi thị, định vị dữ liệu được cộng, tìm- 
nạp dữ liệu từ bộ nhớ, thực hiện phép cộng và lưu kết quá. Đáy là 
một thí dụ về một chức năng được di chuyến theo hướng từ dưới lên, 
từ cấp phần cứng lên cấp vi lập trình. Một lần nữa chúng ta có thể 
nhấn mạnh : không có những qui luật cứng ngắc về một chức năng 
nào đó phai ở trong phần cứng và một chức năng khác phái ớ trong 
phẩn mềm. 

Khi phát triển một máy nhiều cấp, các nhà thiết kế phải quyết 
định oái gì được đặt vào trong mỗi một cấp. Điều này tống quát hóa 
vấn đề trước đây là quyết định đặt cái gì vào phần cứng và cái gì 
vào phần mềm, phần cứng đơn thuần là cấp thấp nhát. Củng cần 
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quan tâm đên một số đặc trưng của các máy tính được thực hiện bới 
phan cưng hoặc VI chương trình, nhưng trước đây rõ ràng đươc lập 
trình ớ câp máy qui ước. Chúng bao gồm ; 

1. Các chỉ thị nhân, chia sô nguyên. 

2. Các chỉ thị sô dâu châm động ( Aoating point ). 

3. Các chỉ thị sỏ chính xác kép ( double precision ). 

4. Các chỉ thị gọi thú tục và quay trờ về từ thú tục. 

5. Các chi thị tàng tốc độ vòng lặp. 

6. Các chi thị đếm ( tăng 1 cho 1 biến ). 

7. Các chỉ thị quản lý các chuỗi ký tự. 

8. Các đặc trưng làm tăng tốc độ tính toán bao gồm các dày 

( array ) ( định địa chỉ chi số [ indexing I và định địa chỉ 

gián tiếp [ indirect addressing I ). 

9. Các đặc trưng cho phép các chương trình di chuyến trong bộ 
nhớ sau khi đã bắt đầu chạy { các tiện nghi cấp phát lại bộ 
nhớ r relocation íacility I ). 

10. Các xung cỉock cho các chương trình định thi. 

11. Các hệ thông ngắt báo hiệu cho máy tính ngay khi một thao 
tác xuất / nhập hoàn tất. 

m 

12. Khả năng treo một chương trình và bắt đầu một chương 
trình khác của một số ít chi thị t chuyên đôi quá trình 
[ process switching J ). 

Vân đề thảo luận ớ đây cho thấy ranh giới giữa phần cứng và 
phần mềm là không nhât định và thường xuyên thay đổi. Phần 
mềm ngày hôm nay có thể là phần cứng cùa ngày mai và ngược lại. 
Hơn nữa ranh giới giữa các câp với nhau cũng thay đổiTheo.quan 
điểm của người lập trình, cách mà một chỉ thị đứợc thực ĩhỉ trên 
thực tế khỏng quan trọng ( có lẽ ngoại trừ tốc. $ộjịtl}ực jttò ịị 'Một 
người lảp trình ờ cấp máy qui ước có thề sử dụng chỉ thị nhan cùa 
câp này như thể chỉ thị này là một chi thị cua phần cứng, kị ỏng 
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cần bận tâm hoặc thậm chí không cần biết có phải thật sự như vậy 
hay không. Phần cứng của một người này có thê là phần mềm của 
người khác. 

Sự kiện một lập trình viên không cần biẽt cáp mà ỏng ta đang 
sứ dụng được thực hiện ra sao, dẫn đến ý tướng thiêt kê máy tính 
có câu trúc ( structured cỏmputer ). Một cảp thường dược gọi là một 
máy ảo do bời người lập trình nghĩ về cấp này như là một máy vật 
lý thật sự dừ điéu này không xảy ra trong thực tê. Bằng cách câu 
trúc một máy thành một chuỗi các càp, những người lập trình làm 
việc trên câp n không cần biết các chi tiẻt hỗn độn cùa các câp 
dưới. Sự cấu trúc này đơn giản hóa mạnh mẽ việc chế tạo các máy 
( áo ) phức tạp, 

1,5 CÁC MỐC QUAN TRỌNG 

Hàng trăm loại máy tính khác nhau đã được thiết kế và chế tạo 
trong suốt quá trình phát triển máy tính số. Đa sô’ các loại máy này 
đã bị bỏ quên từ lâu, nhưng một vài loại đã tác động một cách có ý 
nghĩa đến các ý tưởng hiện nay. Phần này phác thảo tóm tắt một 
số phát triển chính mang tính lịch sử và chỉ nêu ra các sự kiện nối 
bật nhất. Hình 1.4 liệt kẻ một số máy quan trọng được đề cập đến. 
Slater ( 1987 ) là vị trí tốt đê tìm kiếm chất liệu lịch sử thêm nữa 
về con người đã tìm thấy thời đại cùa máy tính. 

1.5,1 Thế hệ các máy tính cơ khí 

Người đầu tiên xây dựng một máy thực hiện công việc tính toán 
( working calculating machine ) là nhà khoa học người Pháp Blaise 
Pascal ( 1623-1662 ), tên của ông đã được dùng đế đặt tên cho một 
ngôn ngữ lập trình. Thiết bị này xảy dựng xong năm 1942 lúc 
Pascal chỉ mới 19 tuổi, được thiết kế dưới sự giúp đờ của người cha, 
một nhân viên thu thuế của chính phú Pháp. Đáy là thiết bị hoàn 
toàn bằng cơ khí sử dụng các bánh răng và được cung cấp lực nhờ 
một cánh tay quay. Máy của Pascal chi làm được các phép toán 
cộng và trừ, và 30 năm sau đó, nhà toán học vĩ đại người Đức 
Baron Gottíried Wilherm von Leibniz ( 1646-1716 ) xây dựng một 
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Nãm 

Tên 

Chẽ tạo bới 

Chú thích 

1834 

Analytic Eng. 

Babbage 

CỐ gắng dầu tiên cúa máy tính sô 

1936 

Zl 

Zuse 

Máy tính dùng rờ-le đầu tiên 

1943 

COLOSSUS 

British gov’t 

Máy tính điện tứ đầu tiên 

1944 

Mark 1 

Ai ken 

Máy tính đa năng cũa Mỹ dáu tiên 

1948 

ENIAC 1 

Eckert/Mauchley 

Lịch sứ máy tính hiện đại bắt đáu 

1949 

EDSAC 

Wilkes 

Máy tính lưu trữ chương trình dấu tiên 

1951 

Whirlwind 1 

M.I.T 

Máy tính thời gian thực dẩu tiên 

1951 

UNIVAC 1 

Eckert/Mauchley 

Máy tính đáu tiên bán trên thị trường 

1952 

IAS 

Von Neumann 

Thiết kế cho da số máy tính hiện nay 

1960 

PDP-1 

DEC 

Máy tính mini dầu tiên 

1961 

1401 

IBM 

Máy tính dùng trong kinh doanh 

1962 

7094 

IBM 

Thòng trị việc tính toán khoa học 

1963 

B5000 

Burroughs 

Máy dùng ngôn ngừ cấp cao đầu tiên 

1964 

360 

IBM 

Sán phàm đáu tiên thiết kè theo họ 

1964 

6600 

CDC 

Máy đầu tiên có cơ chẽ song song nội 

1965 

PDP-8 

DEC 

Máy tính mi ni bán chạy nhát đầu tiên 

1970 

PDP-11 

DEC 

Thống trị các máy tính mi ni 

1974 

8080 

Intel 

CPU da nàng dơn chip dầu tiên 

1974 

CRAY-1 

Cray 

Siẻu máy tính dầu tiên 

1978 

VAX ' 

DEC 

Siêu máy tính 32-bit đầu tiên 


Hình 1.4 Một số mô'c quan trọng trong phát triển máy tmh sô' 


máy cơ khí làm được cả các phép toán nhản và chia. Leibniz đã 
thực hiện được một máy tương đương với một máy tính bỏ túi 4 
chức năng ( four-function pocket calculator ) ra đời sau đó 3 thế ký. 

Không có gì xảy ra trong 150 năm cho đến khi một giáo sư toán 
ở đại học Cambridge, Charles Babbage ( 1792-1871), nhà phát minh 
đồng hồ chỉ tốc độ, đã thiết kế và xây dựng được máy sai phàn 
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{ difference engine ). Thiết bị cơ khí này, giông như máy của Pascal 
chỉ có thể cộng và trừ, được thiết kê để tính toán các báng sỏ 
thường gặp trong ngành hàng hái. Máy được thiẽt kè đẽ chạy một 
giải thuật đơn, phương pháp sai phân hừu hạn sứ cỉụng các đa thức. 
Đặc trưng thú vị nhất cúa máy sai phân là phương pháp xuât : kêt 
quả xuất được đục lỗ trẽn một tấm khắc đồng có đai thép, báo trước 
các phương tiện chỉ ghi một lần như thẻ đục lỗ và đĩa quang. 

Mặc dù máy sai phân làm việc khá hợp lý, Babbage nhanh 
chóng gặp phiền phức với một máy chi chạy được một giãi thuật. 
Ỏng bắt đầu tiêu phí một lượng lớn thời gian và tài sán cúa gia 
đình ( không kẽ 17000 báng Anh của chính phú ) vào việc thiêt kê 
và xây dựng một máy kế thừa gọi là máy phân tích ( analytical 
engine ). Máy phản tích có 4 thành phần : bộ lưu trữ ( bộ nhớ ), bộ 
tính toán, thành phần nhập ( đầu đọc thẻ đục lỗ ) và thành phần 
xuất l in và đục lỗ ). Bộ lưu trữ chứa 1000 từ 50-sô thập phân dùng 
để lưu các biến và các kẽt quá. Bộ tính toán có thể nhận các toán 
hạng từ bộ lưu trữ, cộng, trừ, nhân hoặc chia chúng và trả kết quả 
về bộ lưu trữ. Máy này cũng hoàn toàn bằng cơ khí như máy sai 
phân. 


Tiến bộ lớn cúa máy phản tích là đa năng ( general purpose ). 
Máy đọc các chỉ thị từ các thẻ đục lỗ và thực thi chúng. Một số chỉ 
thị ra lệnh cho máy tìm nạp 2 số từ bộ lưu trừ, mang chúng đến bộ 
tính toán, thực hiện phép tính và gới kết quả có được trơ về bộ lưu 
trữ. Các chi thị khác có thế kiểm tra một sô* và rẻ nhánh có điều 
kiện dựa trên sô* đó âm hay dương. Bằng cách đục lỗ một chương 
trình khác trên các thẻ nhập, máy phân tích có khả năng thực hiện 
các tính toán khác, điều này không có trên máy sai phân. 


Máy phân tích như vậy lập trình được bằng một ngôn ngữ đơn 
gián, máy cần phần mềm. Đê tạo ra phần mềm này, Babbage đã 
thuê một người trẻ tuổi tên là Ada Augusta Lovelace, con gái của 
một nhà thơ lừng danh, Lord Byron. Ada Lovelace là lập trình viên 
máy tính đầu tiên trên thế giới. Tên của Ada được đặt cho một 
ngôn ngữ lập trình hiện nay. 
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Vấn đề không may cùa Babbage là ông cần hàng ngàn trên 
hàng ngàn các răng ( cog ), bánh xe ( wheel ) và bánh răng ( gear ) 
được chế tạo với độ chính xác mà công nghệ của thế kỷ 19 không 
đủ khả năng đáp ứng. Tuy vậy ý tuớng của ông dã vượt thời gian, 
thậm chí ngày nay hầu hết các máy tính đều có cấu trúc tương tự 
như máy phân tích, do vậy thật còng bàng khi cho rằng Babbage là 
cha đẻ cùa máy tính số. 

Phát triển quan trọng kế tiếp xáy ra vào những nám 1930, khi 
một sinh viên kỹ thuật người Đức tên là Konrad Zuse xây dựng một 
chuỗi các máy tính toán tự động ( automatic calculating machine ) 
bằng cách sứ dụng các rờ-le từ. Zuse đã không biêt công việc cúa 
Babbage và các máy cùa Zuse dả bị quân Đồng minh phá hủy khi 
họ ném bom vào Berlin năm 1944. Công việc cùa Zuse do vậy 
không có một ảnh hướng nào đến các máy tiếp theo, nhưng ông vẫn 
là một trong nhừng người tiên phong trong lĩnh vực này. 

Sau đó ít lâu, tại Hoa kỳ, cũng có 2 người đả thiết kẻ' các máy 
tính ( calculator ), John At.anasoíí ớ đại học Iowa State và George 
Stibbitz ở Bell Labs. Máy của Atanasoff đă được cải tiến một cách 
đáng kinh ngạc vào thời điếm này. Máy sứ dụng sô nhị phân và có 
các tụ điện làm bộ nhớ được làm tươi có chu kỳ đê giữ cho điẹn tích 
trên tu không bị rò rỉ, một quá trình mà Atanasoff gọi la gợi lại 
trí nhớ ” ( jogging the memory ). Các RAM động ( dynamic RAM ) 
hiện nay hoạt động chính xác theo cách này. Không may, máy này 
cùng không bao giờ hoạt dộng thật sự. Atanasoff cũng giống 
Babbage, một người giàu tưởng tượng sau cùng bị thất bại do bởi 
công nghệ phần cứng vào thời đó không tương xứng với ý tương. 

Máy tính của Stibbitz, mặc dù đơn gian hơn của Atanasoff, lại 
hoạt đọng được. Stibbitz đưa ra một luận chứng chung tại một hội 
nghị ở đại học Dartmouth năm 1940. Một trong những người thính 
giả là John Mauchley, một giáo sư vật lý chưa nổi tiếng Ư đại học 
Pensylvania, nhưng sau đó thế giới tính toán được nghe nhiều về 

giáo sư Mauchley. 

Trong khi Zuse, Stibbitz và Atanasoff đang thiết kế các máy 
tính tự động ( automatic caiculator ), một người trẻ tuổi tên là 
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Howard Aiken đang nghiền nát các phép tính sô chán ngắt bằng 
tay cho luận văn Tiến sĩ cứa mình ơ Harvard. Sau khi tôt nghiệp, 
Aiken nhận ra tầm quan trọng của việc thực hiện các phép tính 
bằng máy. Aiken vào thư viện, phát hiện ra cóng việc cùa Babbage 
và quyết định xảy dựng máy tính đa nàng ( general purpose ) bằng 
các rờ-le mà Babbage đã thất bại khi xây dựng bàng các bánh răng. 

Máy đầu tiên cúa Aiken, Mark 1, được hoàn tât ớ Harvard vào 
năm 1944. Máy có 72 từ mồi từ 23 sỏ thập phán và có thời gian 
một chu kỳ ( nghĩa là một chi thị } là 6 sec. Việc xuât và nhập dùng 
các băng giây đục lỗ. Cùng vào thời này Aiken hoàn lát máy tièp 
theo, Mark 2, và các máy tính 1 ’ờ-le đã trớ nên lỗi thời. Kỹ nguyên 
diện tử dã bắt đầu. 


1.5.2 Thê hệ các máy tính dèn điện tử - thê hệ thứ nhất 


( 1945 - 1955 ) 

Tác nhân của máy tính đèn điện tứ là thế chiên thứ 2. Trong 
suốt thời gian đầu của chiến tranh, các tàu ngầm cua Đức đã đánh 
phá dừ dội các tàu Anh. Các lệnh được gới từ các dó dốc cua Đức ở 
Berlin đến các tàu ngầm bằng vô tuyến, người Anh có thể và đã 
chận được các lệnh này. Vân dề là các thông điệp này được mật mả 
hóa bằng một thiết bị gọi là ENIGMA, thiết bị này dược thiết kế 
một cách tình cờ bới một nhà phát minh tài tư và là nguyên tống 
thống Hoa kỳ Thomas Jefferson. 

Cơ quan tình báo Anh đã xoay SO' tìm được một máy ENIGMA 
từ cơ quan tình báo Ba Lan, cơ quan này đánh cấp máy từ những 
người Đức. Tuy nhiên đế be được một thòng điệp đã mã hóa phái 
cẩn đến một lượng tính toán khống lổ và việc giai mã cần đươc 
thực hiện ngay sau khi chận được các thòng điệp. Dế giai mã các 
thông diệp này, chính phu Anh thiết lập một phòng thí nghiệm 
tuyệt mật đế xây dựng một máy tính điện tứ gọi là COLOSSƯS. 
Nhà toán học nỗi tiếng người Anh AI an Turing dã giúp thiết kế 
máy này, COLOSSƯS hoạt động vào năm 1943, nhung vì chính phủ 
Anh thực tế đã xếp loại mọi khía cạnh cua dự án là bí mật quân sự 
trong suốt 30 năm, dòng dỏi COLOSSƯS về cơ bản đả kết thúc. 
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Máy tính này chỉ có giá trị ghi nhớ như là máy tính sò điện tứ đầu 
tiên trên thè giới. 

Thêm vào việc phá húy các máy cúa Zuse và sự khuyến khích 
xây dựng COLOSSUS, chiến tranh cũng tác động đến sự tính toán 
ở Hoa kỳ. Quân đội cần sáp đặt các bàn máy cho việc ngắm bắn 
cùa các trọng pháo và tháy rằng việc tính toán chúng bằng tay sẽ 
mất nhiều thời gian và có nhiều sai sót. 

John Mauchley, người biết còng việc cùa Atanasoff cùng như cùa 
Stibbitz, biết rằng quân đội quan tâm đến các máy tính cơ khí 
( mechanical calculator ì. Cùng như những nhà khoa học máy tinh 
sau này. Mauchìev clưa ra đẻ nghị trợ cấp yêu cầu quán dội tài trợ 
cho việc xảy dựng một máy tính diện từ. Đẻ nghị dược chấp thuận 
vào năm 1943, Mauchley và sinh viên cua ỏng ta, J. Presper Eckert, 
tiến hành xảy dựng một máy tinh điện tứ gọi là ENIAC < electronic 
numerical integrator and Computer ». Máy này bao gồm 18000 đèn 
diện tứ và 1500 rờ-le. ENIAC cân nặng 30 tấn và tiêu thụ công suất 
140 KW. Về mật câu trúc, máy có 20 thanh ghi, mỗi thanh ghi có 
khá năng lưu giũ' một số thập phản 10 chừ sô'. Máy dược lập trình 
bàng cách thiẽt lập 6000 chuyên mạch nhiều vị trí và két nói vô sô 
đè cắm ( Socket ) với một rừng cáp nối. 

Máy đã không hoàn tất cho đến năm 1946 khi đã quá trề cho 
các mục đích ban dầu. Tuy nhiên vì chiến tranh đã qua, Mauchley 
và Eiker được phép tổ chức một khóa học mùa hè đê mỏ tá các công 
việc của họ cho những bạn đồng nghiệp. Khóa học mùa hè là khới 
đầu sự phát triển ổ ạt trong việc thiết kế các máy tính số lớn. 

Sau khóa học mùa hè lịch sứ. nhiều nhà nghiên cứu khác bát 
đầu thiết kế các máy tính điện tứ. Máy dầu tiên hoạt dộng là 
EDSAC I 1949 ), được thiết kế tại dại học Cambridge ớ Anh bới 
Maurice Wilkes. Các máy khác bao gốm ƠOHNIAC ớ Rand 
Corporation, ILLIAC ở dại học Illinois, MANIAC ớ Los Alamos 
Laboratory và WEIZAC tại viện Weizmann ớ Israel. 

Eckert và Mauchley bắt đầu làm việc trên máy tiêp theo của họ, 
EDVAC { electronic discrete variable automatic Computer ), nhưng 
dư án này đã bị tốn hại khi họ rời bó Penn đế lập một còng ty khới 
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đầu ( start-up company ), công ty máy tính Eckert-Mauchley ở 
Philadelphia. Sau nhiều lần sát ríhập, công ty này trở thành công 
ty Unisys. 

Trong lúc ây, một người trong nhóm dự án ENIAC, John von 
Neumann đến Prìnceton’s Institute of Advanced Studies đê thiết kê 
một phiên bản EDVAC của chính ông ta, máy IAS. Von Neumann 
là một thiên tài, ông nói được nhiều ngôn ngữ và là chuyên gia về 
khoa học vật lý và toán học. Ông có thê nhớ lại tất cá những điều 
nghe, thấy hoặc đọc. Ông có thề nhắc lại nguyên văn một bài viêt 
trong một quyển sách đã đọc nhiều năm trước đây. Vào thời điềm 
bắt đầu quan tâm đến máy tính, ông đã là một nhà toán học xuát 
sắc cúa thế giới. 

Với ông, một trong những điều không thế chối cãi là các máy 
tính lập trình được với một lượng lớn chuyến mạch và cáp sẽ chậm, 
buồn tẻ và không linh hoạt. Von Neumann đi đến nhận thức rằng 
chương trình có thề được biểu diễn dưới dạng sỏ' trong bộ nhớ của 
máy tính cùng với dừ liệu. Ỏng cũng nhận thây sô' thập phán nối 
tiếp được dùng trong ENIAC không gọn, mồi một số được biếu diễn 
bởi 10 đèn điện tứ ( 1 chạy và 9 tắt ) có thế thay thế bằng cách 
dùng số nhị phân song song. 

Thiết kế cơ bản của ông, hiện nay được gọi là máy von 
Neumann, được thiết kế trong EDSAC, máy tính có khả năng lưu 
trữ chương trình đầu tiên, vần còn là cơ sớ cho hầu hết các 
máy tính số thậm chí cho đến hiện nay, sau gần nửa thế kỷ. 
Thiết kế này và máy IAS, được xây dựng với sự cộng tác cua 
Herman Goldstine. Một phác thảo đơn gián của cấu trúc cho trong 
hình 1.5. 

Máy von Neumann có 5 phần cơ ban : bộ nhớ ( memory ), đơn vị 
số học logic ( arithmetic logic unit ), đơn vị điều khiến chương trình 
( program control unit ), thiết bị nhập và thiết bị xuất. Bộ nhớ có 
4096 từ, mỗi từ lưu giữ 40 bit ( 0 hoặc 1 ). Mỗi một từ chứa hoặc 2 
chí thị 20-bit hoặc 1 số nguyên có dấu 39 bít. Mỗi chi thị có 8 bit 
cho biết loại chỉ thị và 12 bit dùng đê’ xác định 1 trong 4096 từ nhớ. 
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Accumulator 


i linh 1.5 Máy von Neumann ban đãu 

Memory : bộ nhứ 

Control unit : đưn vị điều khiến 

Arithmetic logical unit : đơn vị sô học và logic 

Input : thiết bị nhập 

Output : thiết bị xuất 

Trong đơn vị số học logic, tiền dề của một dơn vị xử lý trung 
tâm CPU ( Central Processing unit ) sau này, có một thanh ghi nội 
49-bit đặc biệt gọi là thanh chứa ( accumuỉator ). Một chi thị điển 
hình cộng 1 từ nhớ với thanh chứa hoặc lưu thanh chứa vào bộ nhớ. 
Máy không có scí dâu châm động vì von Neumann cho rằng bất kỳ 
nhà toán học thõng thạo nào cũng phái có kha năng theo dõi dâu 
chấm thập phán ( thực tê là dấu chấm nhị phán ) trong đầu. 

Vào cùng thời gian von Neuinann dang xáv dựng máy IAS. các 
nhà nghiên cứu ớ M.I.T cũng xây dựng một máy tính. Không giống 
IAS, ENIAC và các máy khác cùng loại có chiều dài cúa từ khá dài, 
máy cúa M.I.T, Whirlwind 1, có từ dài 16 bit và dược thiết kế dê 
điều khiển thời gian thực. Dự án này dần đến phát minh ra bộ nhớ 
lõi bời Jay Forrester và cuối cùng dần đến máy tính mini thương 
mại đầu tién. 

Trong khi tất cả điều này dang diễn ra, IBM, một còng ty nhó 
làm thương mại sản xuât các máy đục lỗ cho các thẻ và các máy 
sắp xếp thẻ bằng cơ khí. Mặc dù IBM cung cấp một phẩn tài chính 
cho Aiken, công ty này không quan tâm đến máy tính cho đến khi 
can xuất ra 701 năm 1953, thời gian dài sau khi công ty cúa Eckert 
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và Mauchley là cóng ty sỏ ] trẽn thương trường vđi máy tính 
ƯNIVAC. 701 có 2 K từ 36-bit và 2 chi thị cho một từ. Đáy là máy 
đáu tién trong chuỗi máy khoa học chiếm ưu thê còng nghiệp trong 
một thập niên. 704 ra đời 3 năm sau đó có bộ nhớ lõi 4 K, các chỉ 
thị 36-bit và phần cứng dâu chấm động. Vào năm 1958, IBM bắt 
đáu sán xuất máy tính đèn điện tứ cuối cùng. 709, tăng cường khá 
nang cua 704. 

1.5.3 Thê hệ các máy tính transistor - thê hệ thứ hai 
( 1955 - 1965 > 

Transistor được phát minh 0 ' Bell Labs vào năm 1948 bởi *John 
Bardeen. Walter Brattain và William Shockiev, những người được 
nhặn giái thướng Nobel vật lý nàm 1956 cho phát minh này. Trong 
10 năm, transistor đà cách mạng hỏa máy tính và vào cuối thập 
niên 50 các máy tính đèn diện tư bị loại bó. Máy tính transistor 
đầu tiên được xáy dựng ớ Lincoln Laboratory cúa M.I.T, một máy 
16-bit tương tự Whirlwind 1 và dược gọi ỉà TX-0 ( transistorized 
experìmental Computer 0 ). dược dự định đơn thuần là một thiết bị 
thứ nghiệm. 

Một trong các kỹ sư làm việc trong Laboratory. Kenneth Olsen, 
thành lập cóng ty DEC năm 1957 đế san xuất một máy thương mại 
rất giống TX-0. Đáy là thời điếm 4 năm trước khi máy PDP-1 ra 
đời. do bời các nhà tư ban mạo hiểm đầu tư cho DEC cương quyết 
tin tướng ràng không có thị trường cho máy tính, thay vào đó, DEC 
bán các board mạch nho. 

Cuòi cung PDP-1 xuất hiện váo năm 1961. máy co 1 K từ 18-bit 
và thời gian cua một chu kỳ là 5 microsec. Đạc tinh nay chi bằng 
một nứa cùa IBM 7090. máy tính iransistor kẽ tục máy 709 va là 
máy tinh nhanh nhất thế giới lúc bây giờ. PDP-1 giá $120000 còn 
7090 giá vài triệu đỏ la. DEC bán vài chục mây PDP-1 và công 
nghiệp máy tính mi ni được khai sinh. 

Một trong các máy PDP-1 đầu tiên được dưa đến M.I.T, ớ đáv 
máy này lôi cuốn rất nhanh sự chú ý của một số các thiên tài tre 
Một trong những đối mới của PDP-1 là bộ hiển thị và khả năng vẽ 
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nhiều điểm ờ bất cứ nơi đâu trên màn hình 512 X 512. Trước đó các 
sinh viên đã lập trình trẽn PDP-1 đê chơi trò chiên tranh vũ trụ và 
thế giới có trò chơi video lần đầu tiên. 

Vài năm sau đó DEC giới thiệu PDP-8, một máy 12-bit nhưng 
giá thành ré hơn PDP-1 nhiều ( $16000 ). PDP-8 có Iiìột đối mới 
chính, một bus đơn gọi là omnibus trình bày trong hình 1.6. Một 
bus là một tập các dây nối song song dùng đế kèt nòi các thành 
phần cùa một máy tính. Cấu trúc này được châp nhận và thực hiện 
trong hầu hết các máy tính nhó. DEC cuói cùng bán dược 50000 
máy PDP-8, trở thành người đản đầu trong lĩnh vực kinh doanh 
máy tính. 



Hình 1.6 Omniliuscuti PI)P-tS 

CPU : dưn vị xứ lý trung lâm 
Memory : bộ nhứ 

Console terminal : thiêt bị dầu cuòi 

Paper tape I/O : thiết bị xuất / nhập dùng bâng giấy 

Other I/O : thiết bị xuất / nhập khác 

Trong lúc ấy. phán ứng của IBM đôi với việc phát minh ra 
transistor là xây dựng một phiên bán cùa 709 bàng transistor, máy 
7090 như đã đe cập ỡ trên, và sau dó là 7094. 7094 có thời gian 
một chu kỳ là 2 microsec và bộ nhớ lỏi 32 K từ 36-bit. 7090 và 7094 
đánh dấu sư kết thúc của các máy loại ENIAC, loại máy chiếm ưu 
thế vàc những nàm 60 trong lĩnh vực tính toán khoa học. 

Vào thời điểm IBM trờ thành một sức mạnh chính trong tính 
toán khoa học với 7094, công ty này đà thu dược một lượng lớn tiền 
nhờ bán các máy hướng kinh doanh nho gọi là 1401. Máy này có 
thể đọc và ghi băng từ, đọc và đục lỗ các the, in kết quá nhanh hơn 
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7094 và giá chỉ bằng một phần nhỏ- Máy này tính toán trong khoa 
học rất tệ nhưng lại quản lý các hồ sơ kinh doanh rât tuyệt. 

Máy 1401 không có thanh ghi nào hoặc thậm chí không có 
chiều dài từ cô" định. Bộ nhớ của máy có 4 K 8-bit ( byte ). Mỗi byte 
chứa một ký tự 6 bit, 1 bít quản lý và 1 bit đê chi kẽt thúc từ. Chi 
thị MOVE chắng hạn, có một địa chi nguồn và một địa chí đích, bắt 
đầu di chuyền các byte từ nguồn đến đích cho đên khí gặp bít 1 ớ 
bit kết thúc từ. 

Năm 1964, một cóng ty khới đầu mới, CDC, giới thiệu máy 
6600, một máy có tốc độ nhanh hơn máy 7094 vĩ đại. Máy này được 
ưa chuộng ngay lập tức và CDC bắt đầu lao vào con dường thành 
công của mình. 

Điều bí mật về tốc độ và lý do máy này nhanh hơn nhiều so với 
7094 là bẽn trong CPU có một cơ chế song song thật sự. CPU có vài 
đơn vị chức nàng thực hiện các phép cộng, các đơn vị chức nàng 
khác thực hiện phép nhân, phép chia và tất cá chúng hoạt động 
song song. Với một công việc nào đó, máy có khả năng có 10 chi thị 
được thực thi dồng thời. 

Máy 6600 có một số máy tinh nhỏ bèn trong giúp đờ, nghĩa là 
CPU có thế dùng tất cà thời gian dè xứ lý các con số, đè lại tất cá 
các chi tiết quản lý cõng việc và xuất nhập cho các máy tính nhó 
hơn. 6600 là một mốc quan trọng trong tính toán sô". 

Có nhiều máy tính khác trong thời kỳ này, nhưng chỉ có một 
máy nổi bật với một lý do khá khác biệt và dáng được đề cập, máy 
Burroughs B5000. Các nhà thiết kế các máy như PDP-1, 7094 và 
6600 hoàn toàn bận tâm với phần cứng, hoặc làm cho rẻ hơn 
( DEC ) hoặc làm cho nhanh hơn { IBM và CDC ). Phần mềm hầu 
như hoàn toàn không thích hợp. 

Các nhà thiết kế B5000 có chiên thuật khác. Họ đặc biệt xây 
dựng một máy với ý định lập trình bằng Algol 60, một ngôn ngữ có 
trước PASCAL, và bao gồm nhiều đặc trưng trong phần cứng tạo dễ 
dàng cho công việc cũa trình biên dịch. 
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Ý tường phần mềm cũng được tính đến đã khai sinh, nhưng tiếc 
thay ý tưởng này hầu như bị bỏ quên ngay tức khắc. 

1.5.4 Thế hệ các máy tính IC - thế hệ thứ ba 

( 1965 - 1980 ) 


Mạch tích hợp IC í int.egrateđ Circuit ) hay còn gọi là vi mạch 
được phát minh cho phép vài chục transistor được đặt trong một 
chip đơn. Việc đóng gói này giúp cho các máy tính xây dựng trên IC 
nhỏ hơn, nhanh hơn và ré hơn các máy tính transistor. Một sô máy 
tính có ý nghĩa quan trọng trong thế hệ này được mô tả dưới đây. 

Vào năm 1964, IBM, một còng ty máy tính hàng đầu, có một 
vân đề với 2 loại máy thành công đáng kế là 7094 và 1401. Hai 
máy này không tương thích, một máy có bộ xứ lý các số với tốc độ 
nhanh sử dụng số nhị phân trên các thanh ghi 36-bit, một máy có 
bộ xử lý xuất nhập đáng ca ngợi sử dụng số thập phản nối tiếp trên 
các từ có chiều dài thay đối trong bộ nhớ. Nhiều khách hàng có cả 2 
máy tính và họ không tluch có 2 bộ phận lập trình riêng rẽ, không 
có gì chung. 

Khi đến thời diêm thay thế hai loạt máy này, IBM thực hiện 
một bước cơ bán. IBM giới thiệu một sán phẩm đơn, System 360, 
dựa trên các vi mạch. Máy được thiết kế cho cả tính toán trong 
thương mại và tính toán trong khoa học. System 360 chứa đựng 
nhiều đổi mới, quan trọng nhất là hệ này có một họ khoáng nửa 
chục máy với cùng một hợp ngữ, kích thước và công suất tăng. Một 
khách hành có thể thay thế 1401 bang 360 kiểu 30 và 7094 bằng 
360 kiểu 75. Máy 360 kiêu 75 lớn hơn, nhanh hơn và mắc hơn. 

Phần mềm viết cho một trong các máy kiểu khác nhau, trẽn 
nguyên tắc chạy được trên máy khác. Trong thực tế, phần mềm viết 
cho kiểu nhỏ hơn cùng chạy được trẽn kiếu lớn hơn mà không xảy 
ra vấn đề gì, nhưng khi di chuyến sang máy nhỏ hơn, chương trình 
có thể không khớp trong bộ nhớ. Đây là một cải thiện quan trọng 
cho tình huống xảy ra với 7094 và 1401. Ý tưởng các họ máy được 
ưa chuộng ngay lập tức, và trong khoáng một vài năm hầu hết các 
nhà sản xuất máy tính có một họ các máy chung bắc cầu cho một 
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tầm rộng giá cá và hiệu suất. Một sô đặc tính cũa họ 360 được trình 
bày ớ hình 1.7. Các kiêu khác sẽ giới thiệu sau. 


Dặc tính 

Kiêu :ìu 

Kiêu -lo 

Kiêu 50 

Kiêu 60 

Hiýu suất tương dói 

1 

3.5 

10 

31 

Thời gian 1 chu kỳ í nsec ) 

10UU 

625 

500 

250 

Bộ nhớ cực đại ( K I 

6-1 

256 

256 

512 

Sò byte tim-nạp trong 1 chu ky 

1 

2 

4 

16 

Sỏ các kénh dừ liệu 

3 

1 

3 

-í 

6 


Hình 1.7 Đố nghị han (lâu cua IBM 3bu 


Đối mới quan trọng khác trong 360 là đa lập trình ( multi- 
programming ), có vài chương trình trong bộ nhớ đồng thời đế khi 
một chương trình đang chờ việc xuất / nhập hoàn tất, chương trình 
khác cỏ thê tính toán. 

360 cũng là máy tính đầu tiên có thể mô phóng các máy tính 
khác. Các kiểu nhỏ có thế mỏ phóng 1401, các kiêu lớn hơn có thể 
mô phóng 7094 sao cho khách hàng có thể tiếp tực chạy các chương 
trình nhị phân cũ trong khi đang biến đổi chúng sang 360. Một số 
kiểu của 360 chạy các chương trình cũa 1401 nhanh hơn nhiều so 
với chính 1401 và các khách hàng không bao giờ phải biến đối 
chuơng trình. 

Máy 360 đã giải quyết tình trạng khó xử giữa số nhị phân song 
song và thập phân nối tiếp bằng thoa hiệp : máy có 16 thanh ghi 
32-bit cho số nhị phân nhưng bộ nhớ thiết kế theo hướng byt.e 
giống như 1401 và có các chí thị nối tiếp kiêu 1401 đế di chuyển 
các bản ghi kích thước thay đối ( variable-sized record ) trong bộ 
nhớ. 

Một đặc trưng chính khác trong 360 là một không gian địa chỉ 
thật lớn ( thời bấy giờ ) cho 2 2A byte nhớ ( 16 megabyte ). Với bộ 
nhớ giá vài đô la một byte vào thời này, 16 megabyte dường như là 
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4300, 3080 và 3090 đều cũng su' dụng dứng cảu trúc này. Vào giửa 
thập niên 80, giới hạn 16 megebyte thực sự trớ thành một vãn dè 
và IBM đã phái từ bo tung phân sự tương thích khi cần 32-bit địa 
chi dẻ địa chi hoa bộ nhơ mơi '2 bvte. 

Với nhận thức muộn máng. C’U thé rut ra két luận ráng VI chúng 
có các từ va các thanh ghi 32-bit. có lẻ chung nén có cac địa chi 32 
bít. Nhưng 0 ' thời đièm này không một ai có thê tương tượng dược 
một may với bộ nhớ 16 megnbyte. Chẽ trách IBM do thiêu tương 
tượng giông như chè trách một người ban máy tính hiện nay chi có 
32-bit địa chi. bới vi trong vãi nam ĩãt ca eac may tinh ca nhan sẽ 
cán nhiêu hơn 4 gigabyte I 1 gigabyte bàng 10' bvte I va các dịa chi 
32-bit trơ nên quá nho. 

Thê giới máy tinh mi ni cũng dà co một bước tiên lớn trong thế 
hệ máy Tinh vi mạch khi DEC giơi thiệu may PDP-11, một kê thừa 
16-bit cua PDP-8. về nhiêu mạt. PDP-11 giống như một người em 
nho cua họ 360 cũng như PDP-S dõi với 7094. Cá 2 máy P0P-11 và 
360 đều có các thanh ghi hương từ va một bộ nhó' hướng byte, ca 2 
đều có một ti lệ giá ca / hiệu suât khá lớn. PDP-11 thành còng rát 
lớn, đặc biệt ờ các trường đại học và DEC tiếp tục dần dầu so với 
các nhà sán xuất máy tính mini khác. 

1.5.5 Thê hệ máy tính cá nhản và VLSI - thê hệ thứ tư 
( 1980 - 200?) 

Vào thập niên 80, vi mạch loại VLSI ( very large scale 
integration ) có khả năng chứa trước tiên vai chục ngàn rồi đen vái 
trăm ngàn và cuối cùng vài triệu transistor trên một ehip đơn như 
hiện nay đã dược chế tạo. Sự phát triến này dẫn đến việc san xuất 
các máy tính nho hơn và nhanh hơn. Trước PDP-1, các máy tinh 
lớn và đát đến nỗi các cõng ty va các trường đại học phai co các bo 
phận đặc biệt gọi lã các trung tám máy tinh đế chạy chung. Vơi sự 
ra đời cúa máy tính mini, một bộ phận như vậy cớ thế mua may 
tính cho chính họ. Vào năm 1980. giá ca giảm xuông thấp đèn nỗi 
một cá nhản có thế sớ hữu một may tính. Thời dại máy tinh cá 
nhản đả bát đầu. 
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Các máy tính cá nhân được sứ dụng theo cách rât khác với máy 
tính lớn. Chúng được dùng cho việc xứ lý từ í vvord Processing ), các 
spreadsheet và nhiều ứng dụng hỗ tương khác mà các máy tính lớn 
hơn không thể thực hiện tốt được. 

Hiện nay các máy tính đại khái được chia thành 5 loại ( có 
phần chồng chéo lẽn nhau ) như trong hình 1.8 dựa trẽn kích thước 
vật lý, hiệu suât và các linh vực ứng dụng. Tháp nhât chúng ta có 
các máy tính cá nhân, các máy xách tay sứ dụng một bộ xử lý dơn 
chip thường dành cho các cá nhãn. Chúng dược sứ dụng rộng rãi 
trong lĩnh vực văn phòng, giáo dục, v.v... . 


Loại 

MIPS 

Megíibyte 

Máy 

Sứ dụng 

Máy tính cá nhản 

1 

1 

IBM PS/2 

Xứ lý từ 

Máy tinh mini 

2 

4 

PDP-11 / 84 

Diốu khiên thời gian 
t hực 

Siêu máy tính mini 

10 

32 

SƯN-1 

May chú trẽn mạng 

Mainữame 

30 

128 

IBM 3090 / 300 

Ngàn hàng 

Siêu máy tính 

125 

1024 

Cray 2 

Dự báo thời li ốt 


Hình 1.8 5 loại máy tính lổng quái 


Các máy tính mini được sứ dụng rộng rãi trung các ứng dụng 
thời gian thực, thí dụ điều khiên không lưu hoặc tự dộng hóa các xí 
nghiệp. Một cách chính xác , khó nói rang diều gì đã cảu tạo nên 
máy tính mini, nhiều cỏng ty thực hiện 1 sản phám bao gồm một 
bộ vi xử lý 16-bit, 32-bit hoặc 64-bit, bộ nhớ và các chip I/O ( xuất / 
nhập ), tát ca chì trên một board mạch đơn, Theo chức năng, một 
board mạch như vậy tương dương với một máy tính mi ni truyền 
thống như PDP-11. 

Siêu máy tính mini chữ yếu là một máy tính mini rất lớn, hầu 
như luôn luôn dựa trên một bộ xứ lý 32-bit hoặc 64-bit và được 
trang bị bộ nhớ vài chục megabyte dến hàng gigabyte. Các máy như 
vậy được dùng như là các'hệ thống chia xé thời gian, các máy chù 
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( íĩle server ) trong mạng và nhiều ứng dụng khác. Các máy này 
còn xa mới mạnh hơn IBM 360 kiểu 75, một mainírame mạnh nhât 
thê giới ở thời điểm được sản xuất ( 1964 ). 

Các mainírame truyền thống là các kế thừa của các loại máy 
IBM 360 và CDC 6600. Khác nhau thật sự giữa một mainírame và 
siêu máy tính mi ni là khả nâng xuất / nhập và các ứng dụng được 
sử dụng trên chúng. Một siêu máy tính mini điên hình có thế có 
một hoặc hai đĩa vài gigabyte. Các mainírame có thế có 100 đĩa 
như vậy. Các siêu máy tính mini thường dùng trong các ứng dụng 
hỗ tương, trong khi các mainírame dùng trong các nhóm công việc 
lớn hoặc xử lý các công việc kinh doanh hoặc những công việc cần 
nhiều cơ sở dữ liệu lớn như ngân hàng, giừ trước vé máy bay, v.v... . 

Các siêu máy tính được thiết kế đặc biệt đê cực đại hóa số các 
thao tác dấu châm động trong một giây FLOP ( íloating point 
operations per second ). Máy nào dưới 1 gigaílop / sec không được 
xem là một siêu máy tính. Các siêu máy tính có cáu trúc song song 
để dạt được tốc độ này và chi có hiệu quá đối với một scí nhó vấn 
đề. 

Trong nhiều năm, các tên siêu máy tính và Seymour Cray hầu 
như đồng nghĩa. Cray thiết kê CDC 6600 và máy kê thừa 7600. 
Ông thành lập một công ty riêng, Cray Research, để’ chế tạo Cray-1 
và Cray-2. Năm 1989, Cray bó đi thành lập một công ty khác để 
chế tạo Cray-3. 

1.5.6 Họ Intel 

Năm 1968, công ty Intel được thành lập dế chế tạo các chip 
nhớ. Thời gian ngắn sau, công ty này được các nhà sản xuất máy 
tính ( calculator ) đặt vấn đề sán xuất một CPU đơn chip cho các 
máy tính của họ và các nhà sản xuất thiết bị dầu cuối đề nghị sản 
xuất bộ điều khiển đơn chip cho các thiết bị đầu cuối này. Intel thực 
hiện cả 2 loại chip này, CPU 4004 4-bit và CPU 8008 8-bit. Đây là 
những CPU đơn chip đầu tiên trên thế giới. 

Intel không kỳ vọng vào ai khác, ngoài những khách hàng này, 
chú ý đến các CPU trên nên họ chí thiết lập một dây chuyền sản 
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xuât cóng suất nho. Họ đả sai lầm. Đã có một khối lượng khùng 
khiếp người quan tâm nên họ đã thiêt kẻ một chip CPU đa năng 
( general purpose ) vượt qua giới hạn bộ nhớ 16 K cua 8008 ( do bới 
sỏ chân trên chip ). Thiết kế này dần đẽn kêt quá một CPU nhó, đa 
năng 8080 ra đời. Cũng như PDP-8, sán phâni này gáy sóng gió 
trong công nghiệp và trớ thành mặt hàng có thị trường lớn. Không 
chi bán ra vài ngàn như DEC đã làm, Intel đả bán vài triệu sán 
phấm này. 

Hai năm sau, 1976, Intel cho ra dời 8085, là 8080 dóng vo chung 
với vài thành phần xuất / nhập thêm vào. Rồi đến 8086 ra đời, một 
CPU đơn chip 16-bit thật sự. 8086 được thiết kế hơi giống 8080 
nhưng không hoàn toàn tương thích với 8080. Tiếp theo sau 8086 là 
8088, chip này có cấu trúc giông 8086, chạy cùng các chương trình 
cùa 8086 nhưng có một bus dữ liệu 8-bit thay vì 16-bit nên giá 
thành rể hơn và chạy chậm hơn. Khi IBM chọn 8088 làm CPU cho 
các máy IBM PC đầu tiên, chip này nhanh chóng trớ thành chuẩn 
công nghiệp cúa máy tính cá nhân. 

Trong vài năm kế tiếp, Intel cho ra đời 80186 và 80188, chúng 
chú yếu là các phiên bán mới cùa 8086 và 8088, nhưng chứa một 
lượng lớn các mạch xuât / nhập. Chúng không bao giờ được sử dụng 
rộng râi. 

8088 và 8086 dếu khóng thê địa chi hóa dược bộ nhớ lớn hơn 1 
megabyte và điều này ngày càng trở thành một vấn đề nghiêm 
trọng trong những năm đầu cùa thập niên 80. Do vậy Intel thiết kế 
80286, một phiên bán tương thích và vượt trội 8086. Tập lệnh cơ 
bản chú yếu giông 8088 và 8086 nhưng tố chức bộ nhớ rất khác và 
rắc rối hơn do yêu cầu tương thích với các chip cũ. 80286 được dùng 
trong IBM PC AT và trong các kiểu PS/2. Giống như 8088, đây là 
một thành công lớn cúa Intel. 

Bước kế tiếp là một CPU 32-bit thật sự trên 1 chip, 80386. 
Giông như 80286, chip này ít nhiều tương thích với các chip dùng 
chung với 8088. Điều này tạo lợi ích cho những người đối với họ 
việc chạy các chương trình cũ là quan trọng nhưng gây thiệt hại cho 
những người thích một cấu trúc đơn gian, rõ ràng và hiện đại 
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không bị trơ ngại bời các lỗi lầm và công nghệ cũ. Giống như 
80286, chip này được sứ dụng rộng rãi. 80386SX là phiên bản đặc 
biệt của 80386 được thiết kế đè thích hợp với các rãnh cắm ( Soc¬ 
ket ) của 80286 nhằm đáp ứng nhu cầu nâng cấp từng phần các 
máy 80286 hiện có. 

80486 tương thích với 80386 và vượt trội hơn. Tât. cả các chương 
trình viết cho 80386 đều chạy được trẽn 80486, không cần sứa đôi 
gì cả. Sự khác nhau cơ bán giữa 80386 và 80486 là sự hiện diện của 
bộ đồng xứ lý dấu chấm động < íloating point coprocessor }, bộ đieu 
khiển bộ nhớ và 8 K bộ nhớ truy cập nhanh ( cache ) trên một chip 
đơn. Thêm vào đó, 80486 nhanh gâp 2 đến 4 lần cùng như thích 
hợp hơn cho các hệ thống đa xử lý so với 80386. 

Chip 80486 DX được giới thiệu đầu tiên vào tháng 4 nãm 1989 
có tốc dộ 25 MHz, những phiên bán tiếp theo có tốc dộ 33 MHz và 
50 MHz. Chip 40486 sx được sản xuất năm 1991 là phiên bán giá 
thành thấp của 80486, giống như 80486 DX nhưng không có bộ 
đồng xử lý dấu châm động trẽn chip. Các chip 80486 xứ lý tôc dộ 
kép DX2 được bắt dầu sứ dụng vào năm 1992 và tiếp theo là các 
phiên bản DX4. Các phiên bán này có nghĩa là nếu xung clock trên 
board mẹ ( mother board ) cùa máy tính cá nhân có tần sô 25 MHz 
( tốc dộ bus 25 MHz ), chip 80486 DX2-50 chạy với tần số xung 
clock 50 MHz ở bên trong ( hệ số nhân là 2 ). Ta có các điển hình 
sau : 

40 MHz DX2 cho những PC có tốc độ bus 16 MHz hoặc 

20 MHz. 

50 MHz DX2 cho những PC có tốc độ bus 25 MHz. 

66 MHz DX2 cho những PC có tốc dộ bus 33 MHz. 

100 MHz DX4 cho những PC có tốc độ bus 25 MHz 

( X 4 ) hoặc 50 MHz ( X 2 ). 

Tháng 10 năm 1992, Intel công bố chip Pentium hay còn gọi là 
80586, chip này bắt đầu được sử dụng vào tháng 3 năm 1993. 
Pentium hoàn toàn tương thích với nhừng chip trước đày 80386 và 
80486 của Intel nhưng có nhiều đặc trưng khác biệt : 
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Pentium có khả năng thực hiện 2 chỉ thị cùng một lúc 
gọi là công nghệ siêu vô hướng ( superscalar tech- 
nology ), công nghệ này có khả năng kêt hợp với các 
máy có tập chỉ thị thu nhỏ RISC ( ređuced instrưction 
set Computer ). Máy RISC sẽ được đề cập chi tiết trong 
chương 8. Pentium tương thích 100% với những phần 
mềm của 80386 và 80486 nhưng có thời gian thực thi 
nhanh hơn nhiều. Intel đả phát triển nhiều trình biên 
dịch mới đế tận dụng khá năng của chip này. 

Pentium có 32-bit. địa chí và 64-bit dữ liệu tuy vẩn chỉ có 
các thanh ghi 32-bit bên trong. 

Pentium có 2 bộ nhớ truy cập nhanh ( cache ) bên 
trong , mỗi bộ 8 K kèm theo bộ điều khiển cache. 

Pentium có tốc độ 75 / 100 / 120 / 133 / 150 MHz. 

Pentium thế hệ 1 có tốc độ 60 / 66 MHz, tích hợp khoảng 3.1 
triệu transistor trên một chip. Pentium thế hệ 2 có các phiên bản 
75 / 100 / 120 / 133 / 150 / 166 / 200 MHz, tích hợp trên 3.3 triệu 
transistor trên một clìip. Các tần số nêu trên là các tần số bên 
trong CPU, băng với tốc độ bus trên board mẹ ( thường là 50 / 60 / 
66 MHz ) nhân với một hệ số ( thường là 1.5, 2, 2.5, 3 ). 

Các chip Pentium MMX ( thế hệ thứ ba ) công bố vào tháng 1 
năm 1997 có tôc độ 66 MHz / 166 MHz, 66 MHz / 200 MHz và 66 / 
233 MHz ( tốc độ bus trên board mẹ / tốc độ bên trong CPU ) với 
trên 4.5 triệu transistor trên một chip. Công nghệ MMX được Intel 
phát triển để đáp ứng nhu cầu về truyền thông đa phương tiện. 
Nhiều ứng dụng như thế chạy những vòng lặp các chỉ thị làm tiêu 
phí nhiều thời gian, MMX phối hợp một tiến trình được Intel gọi là 
đơn chí thị đa dữ liệu SIMD { single-instruction multiple-data ) cho 
phép một chỉ thị thực hiện cùng chức năng trên nhiều dữ liệu. 
Ngoài ra còn có 57 chỉ thị mới được bổ sung cho Pentium MMX đế 
quản lý dử liệu video, âm thanh và đồ họa. 

Tháng 5 năm 1997 Intel bắt đầu công bố chip Pentium II với 
các tốc độ 66 MHz / 233 MHz, 66 MHz / 266 MHz và 66 MHz / 300 
MHz. Đây là chip kế tục dhip Pentium MMX với khá nàng xử lý 
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những vòng lặp hiệu quả hơn. Pentium II tích hợp 7.5 triệu 
transistor trên một chip. Pentium II có khả năng địa chi hóa bộ 
nhớ tối đa 64 gigabyte với bus địa chỉ bộ nhớ 36-bit. Chip này có 
bus cache tích hợp 64-bit, bus dừ liệu bên ngoài 64-bit và độ rộng 
bus bên trong là 300-bit. 

Sự phát triển trong các CPU cùa Intel phản ánh toàn bộ sự 
phát triển trong công nghiệp máy tính. Trong khoáng gần 30 nãm, 
chúng ta đi từ CPU 4“bit đên CPU 64-bit với độ tăng hiệu suất hon 
vài ngàn lần. Mặt khác, 8086 chứa 30000 transistor còn Pentium II 
chứa trên bảy triệu transistor. Các họ cúa Intel được cho trong hình 
l.*9. 


Tên Năm Chiều dài Độ rộng Bộ nhớ 

thanh ghi bus cực dại 

___ dừ liệu ( byte ) _ Chú thích 


4004 

1971 

4 

4 

1 K 

Bộ vi xứ lý đơn chip dầu tiên 

8008 

1972 

8 

8 

16 K 

Bộ vi xứ lý 8-bit dầu tiên 

8080 

1974 

8 

8 

64 K 

Bộ vi xứ lý da nâng đầu tiên 

8085 

1978 

8 

8 

64 K 

8080 đóng gói lại 

8086 

1980 

16 

16 

1 M 

CPU 16-bit đơn chip đáu tiên 

8088 

1982 

16 

8 

1 M 

CPU sử dụng trung IBM PC 

80186 

1982 

16 

16 

1 M 

8088 + xuất nhập trên 1 chip 

80188 

1982 

16 

16 

1 M 

8086 + xuất nhập trên 1 chip 

80286 

1982 

16 

16 

16 M 

Địa chi hóa dược bộ nhớ 16 M 

80386 

1985 

32 

32 

4 G 

CPU 32-bit đơn chip 

80386SX 

1988 

32 

16 

16 M 

80386 với bus cùa 80286 

80486 

1089 

32 

32 

4 G 

Phiên bân nhanh hơn cùa 386 

Pentium 

1992 

32 

32 /64 

4 G 

Cóng nghệ siêu vú hướng 

Pentium 

II 

1997 

32 

64 

64 G 

Địa chì hóa được bộ nhớ 64 G 


Hình 1.9 IIọ các CPU cùa Intel 
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1.5.7 Họ Motorola 

Một thời gian ngắn sau khi Intel giới thiệu 8080, Motorola, nhà 
cung cấp linh kiện bán dẫn cạnh tranh của Intel đưa ra 6800, Chip 
6800 là chip 8-bit so sánh được với 8080, dược chấp nhận tốt và 
được sứ dụng rộng rãi làm bộ diều khiển cho các thiêt bị công 
nghiệp trong những năm đầu của thập niên 70. Tiêp theo ỉ à chip 
6809, chip này tương thích với 6800 đồng thời được thèm vào các 
đặc trưng phụ tạo dễ dàng cho các phép tính sỏ' 16-bit. 

Vào năm 1979, Motorola giới thiệu một chip hoàn toàn mới 
không tương thích với 6800 hoặc 6809. Đây là điều ít có công ty nào 
đã làm trước dó. Chip mới này, 68000, là ý tướng vượt, qua sự cạnh 
tranh và hấp dần các kỹ sư muốn có một thiết kế hoàn toàn mới 
hơn lá một thiết kế bị dè nặng bơi sự tương thích với các chip đã 
lỗi thời. 

68000 thật sự là sự khới đầu cơ bán từ quá khứ. Mặc dầu phai 
tìm-nạp dừ liệu từ bộ nhớ 16-bit ( nghĩa là bus dừ liệu rộng 16 bit ), 
các thanh ghi mà người lập trình truy xuất dược đều dài 32 bit và 
chip có thế cộng trừ ( nhưng không nhân chia ) các sô 32-bit chi với 
một chí thị. Chip 68000 là một cấu trúc lai giừa 16-bit và 32-bit. 

Nếu bạn đã từng cố gắng xác định một người nào đó thiên về 
phần cứng hay thiên về phần mềm, hãy hói ông ta 68000 là chip 
16-bit hay chip 32-bit. Một kỹ sư phần cứng sẽ báo 16 vì chip có bus 
dữ liệu 16-bit. Một lập trình viên sẽ bảo 32 vì các thanh ghi cùa 
chip dều dài 32 bít. Câu tra lời phụ thuộc vào bối cánh của mồi 
người. 

Các nhà thiết kế cùa Macintosh, Atari, Amiga và các máy tính 
thông dụng khác chọn 68000 vì chip này hoàn toàn cắt đứt với quá 
khứ và có chiều dài từ 32 bít. Nhìn chung chip này khá thành công 
và là chip khới đầu cúa một họ các chip giông như họ Intel. Điều 
khác với họ Intel là các thành viên của gia đình 680x0 rất giống 
nhau, theo quan điểm của người lập trình, các phiên bản mới chi có 
vài chỉ thị được thêm vào từ các phiên bản cũ. Chúng là các thành 
viên của một gia đình theo nghĩa khi một chip mới ra đời, chip này 
luôn luôn chạy dược các phần mềm hiện hành. 
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Chip thứ hai trong họ Motorola, 6S008, gióng hệt 6S000 chi 
khac 0 chô sư dụng bus dừ liệu 8-bit nhằm tạo các sán phấm giá 
thành thấp. Không giống 8088, phiên bán cua Intel 8086, G800S 
không bao giờ được sư dụng rộng rãi. 

Không bao lâu sau người ta muôn thực hiện các hệ diều hành 
tinh vi giông như UNIX trên 68000. Nhiều hệ thông co bộ nhớ ao 
( Virtual memory ), một kỹ thuật cho phép các chương trình có thế 
địa chi hóa một bộ nhớ 1Ớ11 hon bộ nhớ thực sự cua máy tính. Bộ 
nhớ ao ( sè dề cập chi tiết sau trong chương 6 ) làm việc bang cách 
hoán đòi các phán cua chương trình từ bộ nhớ tới dĩa một cách tự 
động khi cản. Hầu như 68000 co kha năng hồ trợ bụ nhớ ao nhưng 
không hoàn toàn. Một số nhó các đặc trưng bị thiếu sót trong chip 
này. 

Motorola giái quyết vấn đề này bang cách dưa ra chip GSŨ10 có 
các đặc trưng cần thiết. ít lâu sau, ehip 08012 dược san xuat. chip 
này gióng 680lu nhưng có thẻni các chán dịa chi de có thê dịa ch) 
hóa bộ nhớ 2 gigabyte thay vì 16 megabyte ít oi. 

Cá 2 chip này thật sự bị thay thế sau một năm khi Motorola 
giới thiệu 68020, một chip 32-bit thật sự có bus dù' liệu 32-bit và các 
chỉ thị nhản và chia 32-bit. 68020 là một thành cóng lớn và là trái 
tim cùa hầu hết các trạm làm việc < \vorkstation ) kỹ thuật và khoa 
học được chẻ tạo bới Sun Microsystems, Apollo và Hewlett-Packard. 
Chip kế thừa 68020 là 68030. Chìp này không chi chứa hoan toàn 
một 68020 mà còn có dơn vị quan lý bộ nhớ ( memorv management 
untt ) trên chip. 

68040, giông như 80486, chứa một CPU, một đồng xu' ly dấu 
chấm động, đơn vị quan lý bộ nhớ và cache trên chip, Dơ có sự phức 
tạp gần như nhau nên khóng có gì ngạc nhiên khi 68040 và 801 su 
tích hợp một lượng transistor trên chip gán bang nhau. 1.2 triệu 
cho 68040 và 1.16 triệu cho 80486. 6S040 chạy cùng phàn mèm với 
68030, do vậy những kết luận về cấu trúc cùa 68030 cùng đúng cho 
68040. Rõ ràng ta có thê so sánh 6S030 với 80386 và 68040 với 
80486. Không còn nghi ngờ gì về sự cạnh tranh tiếp tục giửa các 
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chip cùa Intel và các chip cúa Motorola trong nhiều năm nữa. Hình 
1.10 cho ta một tóm tắt về các chip của họ Motorola. 


Tên Năm Chiẻu dài Độ rộng Bộ nhớ 

thanh ghi bus cực đại 

__ dừ liệu < byte ) _ Chú thích 


68000 

1979 

32 

16 

16 M 

Thành viên đầu tiên cùa họ 

68008 

1982 

32 

8 

4 M 

Chip tốc dộ chậm với bus 8-bit 

68010 

1983 

32 

16 

16 M 

HỒ trợ bộ nhớ áo 

68012 

1983 

32 

16 

2 G 

Phiên bản của 68010 với không 
gian địa chỉ lớn 

68020 

1984 

32 

32 

4 G 

Chip 32-bit thật sự 

68030 

1987 

32 

32 

4 G 

Dơn vị quán lý bộ nhớ trên 
chip 

68040 

1989 

32 

32 

4 G 

Phiên bản nhanh hơn cúa 
68030 


Hình 1.10 Họ các CPƯ của Motorola 

Hiện nay, nhiều công ty trong đó chủ yếu là AMD ( advanced micro 
designs ) và Cyrix sản xuất các bộ vi xử lý hoàn toàn tương thích 
với các bộ vi xử lý của Intel. Chúng mô phỏng toàn bộ các chỉ thị và 
thậm chí phần lớn các chip này tương thích cả các chân của các 
chip Intel. Bất kỳ phần cứng hay phần mềm nào hoạt động trên các 
máy tính cá nhân dùng các chip của Intel cũng sẽ hoạt dộng trên 
các máy tính cá nhân dùng các chip tương thích cúa AMD và Cyrix. 
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Tổ CHỨC HỆ THỐNG MÁY TÍNH 


Máy tính sô bao gồm một hệ thông các bộ xứ lý ( processor ), bộ 
nhớ ( memory ) và thièt bị xuất / nhập ( I/O device ) liên kết nhau. 
Ba thành phần này và cách nôi kết của chúng được giới thiệu trong 
chương này. Đây là cơ sỡ cho việc kháo sát chi tiết các câp riêng 
biệt sẽ được trình bày ớ 5 chương kế tiếp. Bộ xứ lý, bộ nhớ và thiết 
bị xuất / nhập là các khái niệm chính sẽ có mặt ớ mọi cấp, do vậy 
chúng ta sẽ bắt đầu nghiên cứu về cấu trúc máy tính bằng cách xem 
xét lần lượt cả ba khái niệm này. 

2.1 Bộ XỬ LÝ 

Tô' chức của một máy tính hướng đơn bus í simple bus-oriented 
Computer ) được trình bày ớ hình 2.1. Bộ xứ lý trung tâm CPU 
(Central Processing unit ) là “ bộ óc ” cúa máy tính. CPU có nhiệm 
vụ thực thi các chương trình chứa trong bộ nhớ chính ( main 
memory ) bằng cách tìm-nạp các chì thị của chương trình, kháo sát 
chúng và sau đó thực thi chúng một cách tuần tự từng chỉ thị một, 
chi thị này tiếp theo sau chỉ thị khác. 

CPU bao gồm nhiều đơn vị riêng biệt. Đơn vị điều khiến có 
nhiệm vụ tìm-nạp các chỉ thị từ bộ nhớ chính và xác định loại chí 
thị. Đơn vị số học và logic ALƯ ( arithmetic-logic unit ) thực hiện 
các thao tác, như cộng và AND trong đại số logic chẳng hạn, để 
thực thi các chỉ thị. 

Bên trong CPU cũng có một bộ nhớ nhỏ, tốc độ cao thường dùng 
đê lưu trữ các kết quá tạm thời và thông tin điều khiến. Bộ nhớ 
này bao gồm một sô' thanh ghi ( register ), mỗi thanh ghi có một 
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nhiệm vụ riêng. Thanh ghi quan trọng nhất là bộ đếm chương trình 
( program counter ). Bộ đếm này có nhiệm vụ tro tới chí thị kế tiếp 
sè được thực hiện. 


Central Processing unit (CPU) 


Control 

unit 


Arỉthmetic 
logical unit 
(ALU) 


Registers 

□ ộ 

□ □ 


I 


Main 

Memory 


1/0 devices 




Disk 


Prlnter 


Bus 




llìoh 2 1 ru chiíc cua mọi may un 11 (tun gian co mọt CPU vá 2 thiết bị 

xuât/nhập 

Control unit : dưn vị (liru khiiúi 

Arithmetic logical unit AUJ : (lưn vị sú hục lugic 

Registers : các thanh ght 

Ma in memory : bộ nhỡ chinh 

1/0 dovicos : các ihict bị xuát / nhập 

Disk : dĩa 

PrintiT : máy in 

Tên “program counter” đặt cho thanh ghi này có phần không 
chính xác bới vì bộ đếm chương trình thực sự không thực hiện việc 
đêm. tuy nhiên thuật ngữ này dã dược sư dụng phố biến. Một thanh 
ghi khác quan trọng không kém là thanh ghi lệnh IR ( instruction 
register >, có nhiệm vụ lưu giừ chi thị dang được thực hiện. Hầu hết 
các máy tính còn có những thanh ghi khác, trong dó một số thanh 
ghi được dùng đẻ lưu trử các kết qua trung gian cho người lập trình 
ớ cấp 2 và cấp 3. 
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2.1.1 Thực thi chỉ thị 

CPU thực thi từng chi thị một theo một chuỗi các bước nhó sau: 

1. Tìm-nạp chi thị kẽ tiếp từ bộ nhớ vào thanh ghi lệnh IR. 

2. Chuyên bộ đếm chương trình trỏ tới chi thị tiếp sau. 

3. Xác định loại chi thị vừa tìm-nạp. 

4. Nếu chỉ thị sử dụng dữ liệu trong bộ nhớ, xác định nơi chứa 
dừ liệu. 

5. Tìm-nạp dữ liệu vào các thanh ghi nội cua CPU ( nếu có ). 

6. Thực thi chi thị. 

7. Lưu các kết quá vào nơi thích hợp. 

8. Trở lại bước 1 đế bắt đầu thực thi chi thị kè tiêp. 

Chuỗi các bước này thường được xem như là chu kỳ tìm nạp - 
giái mã - thực thi lệnh ( fetch - decode - execute ). Trên đây là 
nhừng thao tác quan trọng nhât cùa tất cá các máy tính. Cách làm 
việc cúa CPU theo mô tá ở trên gẩn giống với một chương trình viết 
bằng tiếng Anh. Hình 2.2 trình bày chương trình này được viết lại 
như một thú tục trong Pascal. 

Trẽn thực tế, ta có thể viết một chương trình mỏ phỏng theo 
nhiệm vụ của CPU đế chứng tó rằng một chương trình có thể không 
cần phái được thực hiện bằng “phần cứng” CPU. Thay vào đó, một 
chương trình có thể dươc thực thi bời một chương trình khác. 
Chương trình khác này sẽ tìm-nạp, khảo sát và thực thi các chi thị 
của chương trình cần được thực thi. 

Một chương trình í như hình 2.2 ) có kha năng tìm- nạp, khảo 
sát và thực thi các chi thị cua một chương trình khác được gọi là 
trình phiên dịch như dà đề cập trong chương 1. Sự tương đương giữa 
bộ xử lý phần cứng và trình phiên dịch có liên quan mật thiết đến 
việc tố chức máy tính. Sau khi định rỏ ngôn ngữ máy L cho một 
máy tính mới, nhóm thiết kế có thế quyết định hoặc họ sẽ xây 
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type tvord - ... ; 
address = ... ; 

mem = arrayto .. 4095] of ỉvord ; 

procedure m/e/pre/orìmemory.mcm ; ac.ivord ; StartingAddress.address) 

{ Thú tục này phiên dịch các chương trình cho một máy đơn gián với 1 chỉ thị / 
từ. Bộ nhử bao gồm một chuỗi từ được đánh số 0. 1 , .. . 4095. Máy có 1 thanh ghi 
cùa bộ xử lý gọí ỉà ac dùng cho phép toán sô học. Chi thị ADD cộng 1 từ với ac 
chăng hạn. Trình phiên dịch chạy cho đến khi bít chạy { run bit ) chuyến trạng thái 
thụ động { turned off ) bđi chỉ thị HALT. Trạng thái cúa quá trình chạy trên máy 
này bao gồm bộ nhớ, bộ đếm chương trình, bit chạy và ac. Trạng thái khới đầu dược 
chuyến vào thông qua các thông sô ). 

var ProgramCounter, DataLocation : address ; 

InstrRegisler, data : word ; 

DataNeeded : bouỉí '011 ; 

InstrType : integer ; 

Run bít : 0 .. 1 ; 
begỉn 

PrograniCoiiìtter .*= StartingAddress ; 

Run BU 1 ; 
while Run Bi í = I do 
begin 

I Tim nạp chi thị kế vào thanh ghi lệnh ) 
ỉnatrRcgịstcr := memovyỊProgrumCounter] ; 

( Chu hộ dom chương trình tro đốn chi thị kế í 
Progra/nCounter ;= ProgmmCounter + / ; 

( Giãi mà chi thị và lưu loại cùa chi thị t 
Determìnelns(rTypclỉns(rRcgistcr.ỊItstrType) ; 

( Định vị dù liệu dược sứ dụng trong chỉ thị ) 

PindDiitỉitỉnstrTypư.lnsíríiegisíer.Data.Locaíioti,DatoNeeded) ; 

( Tìm nạp dử liệu từ bụ nhú nêu cắn ) 
if DaỉaNeeded then data := memorylDatuLocalìon] ; 


( Thi hành lệnh t 

execu(e(InsỉrType.duta.nieniory,oc,PrỡgraniCoun(er,RunBit) ; 

cnd 

end ; 

Hình 2,2 Trình phiên dịch cho một máy tính đơn giãn 




Chương 2: Tố chức hệ thống máy tính 


dựng một bộ xử lý phần cứng thực thi trực tiếp các chương trình 
viêt bằng ngôn ligữ máy L, hoặc thay vào đó sè viết một trình phiên 
dịch. Nêu chọn cách viêt một trình phiên dịch, họ phai cung cấp 
một máy đế chạy trình phiên dịch này. 

Do bời trình phiên dịch phân chia các chí thị cùa máy đích ( 
target machine ) thành các bước nhò, máy mà trình phiên dịch chạy 
trên đó thường đơn giản hơn nhiều so với phán cứng cứa bộ xứ lý 
xây dựng cho máy đích. Vì ly do kinh té cũng như vì một sô lý do 
khác, các chương trình ớ cảp máy quy ước của hâu hết các máy tính 
hiện nay đều được thực thi bới một trình phiên dịch chạy trên một 
máy cấp 1 đơn giản hơn nhiều và hoàn toàn khác, mà ta gọi là cấp 
vi chương trình. 

Tập hợp tất cá chỉ thị người lập trình có thể sứ dụng ớ một cấp 
được gọi là tập các chi thị hay tập lệnh ( instruction set ) của cấp 
đó. Số chi thị trong một tập lệnh khác nhau đối với từng loại máy 
và từng cấp. Lây thí dụ đôi với cấp máy quy ước, số chí thị cứa một 
tập lệnh thường trong khoảng từ 20 tới 300. Một tập lệnh có sô chi 
thị lớn (. tập lệnh lớn ) không nhất thiết tốt hơn một tập lệnh có số 
chỉ thị nhỏ ( tập lệnh nhỏ l Xu hướng trong thực tế sẽ ngược lại, 
một tập lệnh nhỏ sẽ tốt hơn. Một tập lệnh lớn thường tồn tại nhiều 
chí thị không dược sử dụng rộng rãi. 

Các trình biên dịch ( compiler ) cua các ngôn ngữ cấp cao như 
Ada, Modula 2 và Pascal thường hoạt động tốt trên các máy có tập 
lênh nhò và đươc chon lọc hơn là trên các máy có tập lệnh lớn, cồng 
kềnh và khó sứ dụng. 

Máy tính với một tập lệnh rất nhỏ, gọi là máy có tập chi thị 
được rút gọn RISC { reduced instruction set Computer ) sẽ được dề 
cập chi tiết trong chương 8. Máy tính này không sử dụng phương 
pháp vi lập trình và thao tác cực kỳ nhanh. 

Trong thực tế, tập lệnh và tố chức của cấp vi lập trình là tập r 
lệnh và tổ chức của phần cứng ( CPU ). Ngược lại, tập lệnh và tổ 
chức của cấp máy quy ước được xác định bới vi chương trình, không 
phải bơi phần cứng. 
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ỈM 

ỂỀẾ. 


2.1.2 Tổ chức của CPU 

Một phần của tổ chức bên trong CPU von Neuinann kinh điển 
được trình bày chi tiết ớ hình 2.3. Phần này được gọi là đường dữ 
liệu ( data path ), bao gồm các thanh ghi ( điền hình từ 1 đên 16 
thanh ghi ) và đơn vị sô học-logic ALƯ. Các thanh ghi được nối đên 
2 thanh ghi nhập của ALU, có tên là A và B như trên hình vẽ. Hai 
thanh ghi này chốt các ngõ nhập của ALƯ trong lúc ALƯ thực hiện 
việc tính toán. 



Hình 2.3 Đường dừ liỹu cua mội máy von Ntmmami diún hình 

Registers : các thanh ghi 

ALƯ input register : thanh ghi nhập cũa ALU 

ALU output register : thanh ghi xuất cùa ALU 

ALƯ thực hiện phép toán cộng, trừ và các thao tác ( operation ) 
dơn giản khác trên các toán hạng ( operand ) chứa trong A và 
B, tạo ra kết quả ở thanh ghi xuất. Dừ liệu trong thanh ghi xuất có 
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thề được cất trở iại một thanh ghi cua CPU hoặc đưa trơ lại bộ nhớ 
nêu muốn. Trong thí dụ này, phép toán cộng được sư dụng đê minh 
họa. 

Các chi thị có thể được chia thành 3 loại: thanh ghi-bộ nhớ, 
thanh ghi-thanh ghi và bộ nhớ-bộ nhớ. Các chi thị thanh ghi-bộ nhở 
cho phép tìm-nạp các từ nhớ < memory word ) vào các thanh ghi. tại 
đó chúng được dùng như là các dừ liệu nhập cùa ALU cho các chi thị 
kế tiếp chảng hạn. Loại chỉ thị thanh ghi-thanh ghi tìni-nạp 2 toán 
hạng từ các thanh ghi, mang đèn các thanh ghi nhập cua ALU, thực 
hiện phép toán trên đó và cất kết qua vào một thanh ghi. Loại chi 
thị bộ nhớ-bộ nhớ tim-nạp các toán hạng tư bộ nho váo trong cac 
thanh ghi nhập cùa ALLT, thực hiện phép toán va sau dó ghi kẽ ĩ qua 
trở lại bộ nhớ. Thao tác cua đường dử liệu ỉa trái tim cua hầu hét 
các CPU. Đế có thế nghiên cứu sâu hơn, người ta muôn xác định 
xem máy tính còn có thè làm dược nhưng gì. Vân đé quan trọng này 
sẽ được đề cập trở lại trong chương 4. 

2.1.3 Thực hiện chỉ thị song song 

Từ những ngày đầu khai sinh ra máy tính, những nhà thiết kẻ 
dã cố gắng tạo ra những máy tính xứ lý nhanh. Trong một số lãnh 
VƯC. máy tính có thê hoạt động nhanh hơn bảng cach tàng toc dợ 
phần cứng. Tuy nhiên, nhiều giới hạn vật lý khác nhau bắt đầu xuất 
hiện khi tăng tốc độ phẩn cứng. Theo các định luật vật lý, không có 
vật thè nào có thê di chuyên với vận tõc nhanh hơn vận tốc cua ánh 
sáng, khoang 30 cm/nsec t nano giãy ) trong chan không và 20 
trong cáp đông. ĩlieu nay co nghía lâ đe xay dựng mọt may 
tính có thời gian lệnh ( thời gian thực thi mọt chi thi ) la 1 nsec, 
toàn bộ khoang cách mà tín hiệu diện có thế di chuyến trong CPU, 
tới bộ nhớ và trớ lại sẽ không thẻ lớn hơn 20 cm. Vi thế các máy 
tính có tốc độ càng nhanh phái có kích thước càng nho. 

Đáng tiếc các máy tính có tốc độ cao sẽ sinh nhiệt nhiều 
hơn các máy có tốc độ thấp, và nếu láp một máy tính vào một 
thể tích nhỏ, sẽ khó tiêu tán nhiệt. Đỏi khi các siêu máy tính đươc 
đăt chìm trong chất lỏng íreon, một chất dùng đế làm nguội nhanh. 
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Nói chung, việc tạo ra một máy tính có tôc độ càng cao sẽ càng khó 
và cũng càng đắt tiền hơn. 

Tuy vậy ta vần có thể sử dụng các phương pháp khác. Thay vì 
dùng một CPU có tốc độ cao, người ta thiết kế một máy tính với 
nhiều ALƯ có tốc độ chậm hơn ( và rẻ hơn ), hoặc thậm chí với 
nhiều CPU đê đạt được cùng một công suất tính toán nhưng với giá 
thành thấp hơn. Nhiều công trình nghiên cứu đã được tiến hành để 
xây dựng những máy tính song song như vậy. Phần này sẽ giới 
thiệu sơ lược một sô kỹ thuật dã sử dụng. 

Máy tính song song được chia thành 3 loại ( theo Flynn, 1992 ) 
dựa vào sô luồng chi thị ( instruction stream ) và số luồng dừ liệu { 
data stream ) của máy tính đó: 

1. SISD : máy loại đơn chỉ thị, đơn dữ liệu 

t single ỉnstruction stream, single data stream). 

2. SIMD : máy loại đơn chi thị, đa dữ liệu. 

( single instruction stream, multiple data stream). 

3. MIMD : máy loại đa chỉ thị, đa dừ liệu. 

( multiple instruction stream, multiple data stream). 

Máy von Neumann truyền thống thuộc loại SISD, có một luồng 
chỉ thị ( nghĩa là một chương trình ) dược thực hiện bới một CPU và 
có một bộ nhớ chứa dừ liệu. Chi thị đầu tiên được tìm-nạp từ bộ nhớ 
và thực thi. Chỉ thị thứ hai được tìm-nạp và thực thi v.v... . 

Ngay trong mô hình tuần tự này, một số giới hạn khá năng song 
song cũng được thực hiện bằng cách tim-nạp và bắt đầu chỉ thị kế 
tiếp trước khi chỉ thị hiện tại hoàn tất. Thí dụ với máy tính CDC 
6600 và một số máy sản xuất sau này, có nhiều đơn vị chức năng, 
đặc biệt là các ALƯ. Mỗi đơn vị có thể thực hiện một thao tác với 
tốc độ cao, như minh họa trong hình 2.4. Trong thí dụ này CPU có 5 
đơn vị chức năng, 2 đơn vị cho mỗi thao tác cộng và một đơn vị cho 
từng thao tác trừ, nhân và chia. 
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Hình 2.4 Một CPU với 5 đơn vị chức năng hoạt động sung song 

Ý tưởng của phương pháp thiết kế này là đơn vị điều khiển tìm- 
nạp một chỉ thị và sau đó đưa đến một đơn vị chức năng thích hợp 
dể thực hiện. Trong lúc đó, đơn vị điều khiến thn-nạp chi thị kế tiếp 
và đưa đến một đơn vị chức nàng khác. 

Quá trình này tiếp tục cho đến khi không thể tiếp tục được nữa, 
hoặc vì tất cả các đơn vị chức năng cùng loại dang bận hoặc một 
toán hạng vẫn còn đang được tính toán. 

Chiến lược tổng quát này rõ ràng hàm ý thời gian thực hiện một 
thao tác phải dài hơn thời gian tìm-nạp một chỉ thị nhiều, vì vậy 
phương pháp này thường dùng cho các thao tác trên các số datr 
chấm động, chúng phức tạp và thực thi chậm so với các thao tác 
n6n cố ncrnvên. chúng đơn giản và thực thi nhanh hơn. 
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Một biến thái cua ý tương này là tách việc thực thi một chí thị 
ra thành nhiều phần, như một xe hơi đang lắp ráp trên băng 
chuyền. Trong hình 2.5(a) ta thây một CPU có 5 đơn vị xứ lý, từ Pl 
đến P5. Trong khoáng thời gian thứ nhất, chi thị đầu tiên được tìm- 
nạp từ bộ nhớ bơi Pl, như trong hình 2.5(bt Trong khoảng thời 
gian thứ hai. chi thị đầu tiên được chuyên sang P2 đè phân tích, 
trong lúc đó Pl tìm-nạp chí thị kẻ tiếp, ơ mỗi khoáng thời gian tiếp 
theo, một chi thị mới được tìm-nạp bới P1 và những chì thị khác 
được chuyến sang đơn vị xứ lý kê tiếp theo đường dần. 


P1 P2 P3 P4 P5 



(a) 


P1: 

01 

E 

E 

0 

E 

0 

m 

E 

E 

P2: 


0 

E 

0 

0 

E 

0 

m 

E 

P3: 



0 

E 

E 

0 

E 

E 

E 

P4: 




m 

E 

B 

0 

E 

E 

P5: 





0 

E 

0 

s 

E 


1 

2 

3 

4 

5 

6 

7 

8 

9 


Time — 
(b) 


Hình 2.5 (aí Mặt ma\ dường ùng cu 5 dưn vị XƯ ly 

(b) Trạng thái cua mỗi dơn vị xư lý như là hàm theo thời gian 

Instruction fetch unit : đơn vị tìm-nạp chi thị 
Instruction anaỉyzer : hộ phân tích chi thị 
Address caỉculation unit : đơn vị tính địa chỉ 
Data fetch unit : dơn vị tìm-nạp dữ liệu 
Instruction executiun unit : dơn vị thực thi chi thị 
Time : thời gian 

Cách tổ chức như trong hình 2.5(a) được gọi là máy đường ống ( 
pipeline maehine ). Nếu thời gian dành cho mồi đơn vị xử lý là n 
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nsec, phải mất 5/2 nsec để thực hiện một chỉ thị. Tuy nhiên, một chì 
thị hoàn tất đều qua P5 cứ sau mỗi n nsec, do vậy tăng tốc độ xứ lý 
lệnh của máy lẽn gấp 5 lần. 

Chú ý rằng mặc dù máy sứ dụng một cơ chế song song bên 
trong, một máy đường ông vần là máy SISD do bởi chỉ có một 
chương trình và một tập dừ liệu. Ngược lại, các máy SIMD thao tác 
trên nhiều tập dữ liệu song song, ứng dụng điên hình cua loại máy 
SIMD là dự báo thời tiết. Thí dụ như tính nhiệt độ trung bình hàng 
ngày cho nhiều vùng và đối với từng vùng, phương pháp tính đều 
giống nhau nhưng với các dữ liệu khác. 

Một cấu trúc khá thích hợp cho công việc này là máy vector t 
vector machine ) được trình bày trong hình 2.6(a). Đường dử liệu ờ 
đây tương tự như trong hình 2.3, chi khác ớ chỗ thay vi có một biến 
đơn cho từng ngõ nhập của ALU. ta có một vector với n ngõ nhập. 
Tương tự, ALU thực sự là một vector ALƯ, có khá năng thực hiện 
một thao tác như là phép cộng vector ( trong hình 2,6(b) ) trên 2 
vector nhập và kết quá được lấy ra ớ vector xuất. Một. 30' siêu máy 
tính có cấu trúc tương tự với cấu trúc này. 

Một máy khác gần giông với SIMD là bộ xứ lý dãy ( array 
processor ), một thiết kế được mở đầu bởi trường Đại học Illinois. 
Đó là máy tính ĨLLIAC IV như minh họa trong hình 2.7 { theo 
Hord, 1982 ). Câu trúc này bao gồm một mạng vuỏng các phần từ bộ 
xử lý / bộ nhớ. Một đơn vị điều khiến truyền các chi thị và chúng 
được thực thi bới tất cả các bộ xử ỉ ý theo kiểu theo sát gót ( 
lockstep ), mỗi bộ xử lý sứ dụng dừ liệu riêng lây từ một bộ nhớ 
riêng ( dữ liệu được nạp trong pha thiết lập trạng thái ban dầu ). Bộ 
xử lý dãy đặc biệt thích hợp cho việc tính toán các ma trận. 

Loại máy thứ ba của Flynn là MỈMD, trong đó các CPU khác 
nhau làm việc với những chương trình khác nhau, thinh thoáng 
chúng sử dụng chung một bộ nhớ. Hệ thống đặt chỏ trước trong máy 
bay là một thí dụ, nhiều người cùng đặt chỗ đồng thời nhưng không 
tiến hành song song, mà từng chí thị một vì chúng ta có nhiều luồng 
chỉ thị và nhiều luồng dử liệu. 
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Hình 2.6 (a) Vector ALƯ 
(b) Thí dụ về phép cộng vector 

Input vectors : các vector nhập 
Outpul vector : voctnr xuất 
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Hình 2.7 Bộ xứ iý dãy cua máy ILLIAC IV 
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Control unit : đơn vị điều khiển 
Broadcasts instructions : truyền các chỉ thị 

8x8 processor / memory grid : mạng 8x8 phần tử bộ xứ lý / bộ nhớ 
Processor : bộ xử lý 
Memory : bộ nhớ 

Hình 2.8(a) trình bày một bộ đa xử lý ( multiprocessor ), một 
máy MIMD sứ dụng bộ nhớ dùng chung ( shared memory ). Các bộ 
xứ lý truy xuất tới bộ nhớ dùng chung thông qua bus. 



Shared 


Bus 


Local memorles 


Bus 


Shared 


Hình 2.8 (a) Bộ đa xứ lý ( multiprocessor ) cơ ban 
(b) Bộ da xử lý có các bộ nhớ nội ( Iocal memory ) 

CPU : dơn vị xử lý trung tâm 
Shared memory : bộ nhớ dùng chung 
Local memories : các bộ nhớ nội ( cục bộ ) 

Không cần phải tương tượng nhiều ta cũng thấy rằng với nhiều 
bộ xứ lý tốc độ nhanh truy xuất đồng thời tới bộ nhớ chung trên 
cùng một bus, hậu quá xảy ra là có sự xung đột ( conílict ). Những 
nhà thiết kế bộ đa xứ lý đã tìm ra những sơ đồ khác nhau nhằm 
giảm thiểu sự tranh chấp và cải thiện hiệu suất. Một thiết kế dược 
trình bày trong hình 2.8(b) cho thấy mỗi bộ xử lý có một bộ nhớ nội 
riêng, các bộ xứ lý khác không thể thâm nhập đến. Bộ nhớ này sử 
dụng cho các mã chương trình và các dừ liệu không cân dùng chung. 
Việc truy xuất bộ nhớ riêng không dùng đến bus chính sè làm giảm 
một lượng lớn lưu lượng trên bus chính. 
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Các bộ đa xử lý khác không sử dụng một bus mà dùng nhiều bus 
để làm giảm tải. Một sô’ khác sứ dụng caching, một kỹ thuật lưu giữ 
các từ nhớ được thường xuyên sử dụng trong từng bộ xử lý. Caching 
sẽ được đề cập chi tiết trong chương 4. Một nghiên cứu về các câu 
trúc đa xử lý được Gajski và Pier đưa ra vào năm 1985. 

2.2 Bộ NHỚ 

Bộ nhớ là một phần của máy tính dùng đế chứa chương trình và 
dữ liệu. Một sô khoa học gia về máy tính ( đặc biệt các nhà khoa 
học người Anh ) thường dùng thuật ngữ store hoặc storage hơn là 
metnorỵ. Không có máy tính sô nào lưu trừ chương trình mà không 
có bộ nhớ, đê từ đó bộ xứ lý có thể đọc và ghi thông tin. 

2.2.1 Bit 

Đơn vị cơ bản của bộ nhớ là sô nhị phân chì có 1 ký tự sô", được 
gọi ỉà bit. Một bit có thế là 0 hoặc 1. Đây là đơn vị nho nhát { một 
thiêt bị chí có khá năng chứa các sô zero rât khó hình thành cơ sớ 
cho một hệ thông bộ nhớ, ít nhất phái có 2 giá trị ). 

Người ta thường cho rằng các máy tính sứ dụng số nhị phán do 
tính hiệu quả của loại số này. Nghĩa là, mặc dù ít được thừa nhận, 
thông tin sô' có thể được cất giử bằng cách phán biệt các giá trị 
khác nhau của một đại lượng vật lý liên tục như điện áp hoặc dòng 
điện. Càng nhiều giá trị cần được phán biệt, càng ít có sự khác biệt 
giữa 2 giá trị kề cận nhau và càng khó có thể tin cậy vào bộ nhớ. 
Họ thong so nhi phan chi yeu câu 2 giá trị đê phân biệt, do vậy đây 
là phương pháp đáng tin cậy nhất để mã hóa thông tin số. 

Một số máy tính, như các mainírame lớn của IBM, được quảng 
cáo có thể sử dụng cá số thập phân lần số nhị phân. Mưu mẹo này 
đạt được bằng cách dùng 4 bit để chứa một số thập phân. 4 bit cho 
ta 16 tổ hợp, dùng cho 10 số từ 0 tới 9 còn 6 tố hợp không sử dung. 

SỐ 1944 mã hóa ở dạng thập phân và nhị phản được the hiện bằng 
16 bit như sau: 

Dạng thập phân: 0001 1001 0100 0100 
Dạng nhị phân :0000011110011000 
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16 bit ở dạng thập phân có thê chứa các sô" từ 0 tới 9999, chi cho 
10000 tổ hợp trong khi một số 16-bit nhị phân có thể chứa 65536 tổ 
hợp khác nhau. Vì lý do này người ta nói số nhị phân hiệu quá hơn 
số thập phân. 

Tuy nhiên điều gì sẽ xảy ra, nếu có một kỹ sư tré thòng minh 
nào đó tạo ra một thiêt bị diện tử có độ tin cậy cao có thê chứa trực 
tiếp các số từ 0 đến 9 bằng cách chia điện áp từ 0 tới 10 volt thành 
10 khoảng . 4 thiêt bị này có thể chứa bâ't kỳ sô thập phân nào từ 0 
tới 9999. 4 thiết bị như vậy sẽ cung cấp 10000 tổ hợp. Cũng có thế 
dùng chúng đề biếu diễn các sỏ nhị phân, chì dùng 0 và 1. Trong 
trường hợp này ta chi có 16 tò hợp. Với những thiết bị như vậy, rồ 
ràng sô' thập phân có hiệu quá hơn. 

2.2.2 Địa chỉ bộ nhớ 

Bộ nhớ bao gồm một sò các phần tứ nhớ gọi là ccll hoặc còn gọi 
là vị trí nhó' ( location ), mỗi ccỉỉ chứa một mẩu thông tin í piece of 
ỉnỉbrmation ). Mỗi ccỉì có một số gọi là địa chỉ ( ađdress ) của ccỉỉ, 
các chương trình có thế tham chiếu đến các địa chí này. Nếu bộ nhớ 
có n celly chúng sẽ có địa chỉ từ 0 tới n-1. Các ceỉl trong một bộ nhớ 
chứa cùng một sô' bít. Một ccỉỉ có k bit sẽ có thể chứa 1 trong 2 h tổ 
hợp bít khác nhau. Hình 2.9 trình bày 3 cách tổ chức khác nhau cho 
một bộ nhớ 96 bit. Chú ý rằng các ccỉl kế cận nhau sẽ có địa chí kế 
tiếp nhau { do định nghĩa ). 

Các máy tính dùng hệ thông sô' nhị phán ( bao gồm ký hiệu bát 
phân và thập lục phân cho các số nhị phân ) cũng có thê diễn tả địa 
chỉ bộ nhớ bằng số nhị phân. Nếu một địa chỉ có m bit, số cell tối 
đa có thể địa chỉ hóa ( đánh địa chỉ ) trực tiếp là 2"'. Lây thí dụ một 
địa chỉ dùng tham chiếu bộ nhớ, như hình 2.9(a), cần ít nhâ't 4 bit 
đê diễn tả các số từ 0 tới 11. Tuy nhiên chỉ cần 3 bit để diễn tả địa 
chỉ trong các hình 2.9(b) và 2.9(c). Sô' bit trong địa chỉ liên quan đến 
số cell tối đa có thê địa chí hóa trực tiếp trong bộ nhớ và không tuỳ 
thuộc vào số bít cúa mỗi ceỉl. Một bộ nhớ có 2' 2 ceỉl, mồi ceỉl có 8 bit 
và một bộ nhớ có 2 12 celỉy mỗi cell có 60 bit đều cần các địa chí 12- 
bit như nhau. 
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Hình 2.9 Ba phương pháp tỏ chức bộ nhớ 96 bit 
Adđress : địa chỉ 

Số bit mỗi cell đối với một số máy tính đã được bán trên thị 

* */ • * 

trường như saư: 


Burroughs B1700 

1 bit mỏi cell 

IBM PC 

8 bit mỗi cell 

DEC PDP - 8 

12 bit mỗi cell 

IBM 1130 

16 bit mỗi cell 

DEC PDP -15 

18 bit mỗi cell 

XDS 940 

24 bit mỗi cell 

Electrologica X8 

27 bit mỗi cell 

XDS Sigma 9 

36 bit mồi cell 

CDC 3600 

48 bit mỗi cell 

CDC Cyber 

60 bit mỗi cell 


Như đã đề cập ờ trên, ceỉl là đơn vị nhỏ nhất được địa chỉ hóa. 
Trong những năm gần đây, hầu hết các nhà chế tạo máy tính đều 
chuấn hóa 1 ccỉỉ có 8 bit và gọi là một byte. Nhiều byte gộp lại 
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thành từ ( word ). Một máy tính sử dụng 1 từ 16-bit nghĩa là máy có 
2 byte / từ, trong khi đó một máy dùng 1 từ 32-bit sẽ có 4 byte / từ. 
Hầu hêt các chỉ thị của máy tính đều thao tác trên từ, thí dụ cộng 2 
từ với nhau. Do vậy, một máy 16-bit sẽ có các thanh ghi 16-bit và 
các chỉ thị để thao tác các từ 16-bit, các máy 32-bit sẽ có các thanh 
ghi 32-bit và các chỉ thị đề thực hiện phép dịch chuyến, cộng, trừ và 
các thao tác khác trên các từ 32-bit. 

2.2.3 Trật tự của byte 

Các byte trong một từ được đánh số từ trái sang phải hoặc từ 
phải sang trái. Sự lựa chọn này thoạt nhìn không quan trọng nhưng 
bao hàm một ý nghĩa rất lớn. Hình 2.10(a) mièu tá một phần bộ 
nhớ của một máy tính 32-bit, trong đó các byte được đánh sô từ trái 
sang phái dối với họ Motorola chẳng hạn. Hình 2.10(b) đại diện cho 
họ máy tính 32-bit dùng phương pháp đánh số từ phải sang trái 
chẳng hạn như họ Intel. Hệ thông trước đánh sỏ' bắt đầu từ số lớn ( 
nghĩa là bậc cao ) gọi là máy tính big-endian, ngược lại là litth’ 
endian như trong hình 2.10(b), Các thuật ngừ này do ơonathan 
Swift - một nhà chính trị châm biếm - đặt ra và được dùng lần đẩu 
tiên trong câu trúc máy tính vào năm 1981 trên một bài báo đầy 
thú vị của Cohen. 
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Hmh 2.10 (a) Bộ nhớ hệ big-endian 

(b) Bộ nhớ hệ ỉittie-endỉan 

Address : địa chì 
32-bit word : từ 32-bit 
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Thi dụ sau cho ta thây diều quan trọng cần hiếu trong cả;2 hệ 
thông bìg-endian và littlc-cndicin. Sô nguyên 32-bit có giá trị 6 được 
biếu diều bới các bit 110 ơ 3 bit cực phải cúa từ í bậc thâp ) và 29 
bit zero ớ cực trái. Trong sơ đồ big-cndian, nhừng bit này ớ byte thứ 
3 ( hoặc 7, 11, ... ) trong khi đó ớ sơ đồ little-endian , những bit này ở 
bvte 0 < hoặc 4, 8, ... ). Trong cả 2 trường hợp, từ chứa sỏ' nguyên này 
đều có địa chì là 0. 

Nêu máy tính chi chứa các số nguyên, sè không có vân đề gì cả. 
Tuy nhiên, nhiều ứng dụng yêu cầu một sự pha trộn các sô nguyên, 
các chuỗi kv tự và cue loại dử liệu khác. Xét một hổ sơ cá nhản bao 
gồm một chuồi I tên nhân vièn ) và 2 số nguyên ( tuổi và số phòng 
ban ). Chuỗi kót thúc bang một hoặc nhiều byte 0 đê điền đầy một 
từ. Biêu điền hig-cndian dược trình bày trong hình 2.11(a) và littỉe- 
cndian dược trình bày trong hình 2.11(b) với tên JIM SMITH, 21 
tuối, phòng sô* 260 ( 1 X 256 + 4 = 260 ). 
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Minh 2.1 ỉ ta) llú sơ cá nhân cho loại máy bìg-vndiuti (b) nồ sơ cá nhân 
cho loại máy hnỉc-ciuỉiun (c) Kõi quà cùa việc chuyển hồ sư từ bịg-endian 
sang littỉe-cndiun (d) Kết quà sau khi hoán vị bylơ { byte SNvapping ) (c) 

Transíbr from big omlian to littlo cndian : chuyến từ hệ big-eiỉdiưn sang hệ 
Ịiltle-cndiun 

Transíer and svvap : ch uy ôn và huân dôi 

Cả 2 phương pháp đều biểu diễn tốt và có tính nhất quán nội 
tại. Vấn đề chỉ nảy sinh khi máy tính muốn gởi hồ sơ trên đến một 
máy tính khác trên mạng. Giả thiết rằng ở từng thời điểm máy 
big-cndian gới từng byte đến máy littlc-cndian , bắt đầu từ byte số* 0 
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và két thúc ơ byte thứ 19 ( gia thiết ràng các bit cua các byte 
không bị đáo ngược do đường truyền ). Byte 0 cùa hệ big-cncỉỉơn đi 
vào byte 0 cùa bộ nhớ hệ littlc-cndìun và cứ tiếp tục như hình 
2 . 11 ( 0 . 

Không có vấn đề gì xáy ra khi máy hệ ỉittỉc-cndícm muốn in tên 
nhân viên, nhưng lúc dó tuối sẽ trớ thành 21 X 2"' và sò phòng dã bị 
lẫn lộn. Tình trạng này xảy ra do việc truyền đà làm đào ngược thứ 
tự của các ký tự trong một từ cũng như làm đáo ngưực các byte 
trong một sô" nguyên. 

Rõ ràng phải có một giái pháp bằng phần mềm đế đói các byte 
trong một từ sau khi sao chép. Như trong hình 2.11(c), còng việc di 
chuyển 2 sỗ nguyên được thực hiện đúng nhưng chuỗi ký tự trớ 
thành “MUTIMS” còn U H” nằm 0 ' một nơi nào dó. Sự đáo ngược này 
do khi đọc chuỗi, máy tính trước tiên đọc byte 0 ( space ), sau đó 
đến byte 1 ( M ) và tiếp tục như vậy. 

Không có giải pháp nào đơn giàn. Có một phương pháp khác 
nhưng cũng không hiệu quá là thêm một ìicadcr trước mỏi Ỉ 1 Ò sơ 
cho biết loại dữ liệu theo sau ( chuỗi, số nguyên hoặc dữ liệu khác ), 
và chiều dài là bao nhiêu. Điéu này cho phép máy tính nhận chi 
phải thực hiện những chuyến dối cần thiẽt. Trong bãt kỳ trường 
hợp nào ta cũng thấy rằng việc thiếu một tiêu chuẩn về trật tự byte 
là nỗi phiền toái chính khi trao đối dữ liệu giửa các máy tính khác 
nhau. 

2.2.4 Mã sửa lỗi 

Thinh thoảng bộ nhớ máy tính cùng tạo ra lỏi do các xung diện 
áp trên đường cấp điện hoậc do những nguyên nhân khác. Đế tránh 
những lỗi như vậy, các bộ nhớ đều dùng các mã phát hiện lỗi hoặc 
các mã sứa lỗi. Khi sứ dụng các mà này, các bit phụ được thêm vào 
ở mỗi từ nhớ theo một phương pháp đạc biệt. Khi đọc một từ ra 
khoi bộ nhớ, các bit phụ được kiếm tra đế xem có lỗi hay không. 

Đế hiếu các lỗi được xứ lý như thế nào ta cần phải biết thực 
sư lỗi là gì ? Gia sứ một từ nhó có m bit dử liệu và ta sẽ thêm vào r 
bit dư thừa ( redunđant. ) hoặc r bit kiếm tra. Đặt toàn bộ chiều dài 
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m 

Ểm 


bit là n ( nghĩa là n = ni + r ). Một đơn vị n bit có ni bit dữ h? u va f 
bít kiêm tra được xem như một từ mã ( code-word ) n bit. 

Cho 2 từ mã 10001001 và 10110001, ta có thể xác định chúng có 
bao nhiêu bít tương ứng khác nhau, ở thí dụ này 2 từ ma co 3 bít 
khác nhau. Đề xác định sô bit khác nhau, ta chỉ cần thực hiẹn phép 
toán XOR theo bit hai từ mã dã cho và đêm số bit 1 trọng kêt quả. 
Sô các vị trí bit 2 từ mã khác nhau gọi là khoảng cách Hamming ( 
Hamming distance ) ( theo Hamming , 1950 ). Ý nghĩa cùa việc xác 
định* khoáng cách là nếu 2 từ mả có khoảng cách Hamming là d, 
cần có d lỗi đơn bít { singie-bit error ) dế đôi mã này thành mã kia. 
Các từ mã 11110001 và 00110000 có khoáng cách Hamming là 3 vì 
cần có 3 lỗi đơn bit đẻ đối mã này thành mả kia. 

Với một từ nhớ m bit, tất cả 2"‘ tố hợp các bit đều hợp lệ nhưng 
do cách tính các bit kiếm tra, chỉ có 2" 1 trong 2" từ mà có giá trị hợp 
lệ. Khi đọc bộ nhớ thấy xuất hiện một từ mả không hợp lệ, máy 
tính hiếu rằng đả xáy ra một lỗi bộ nhớ. Cho một giải thuật dê tính 
các bit kiêm tra, ta có thê xây dựng dược một danh sách các từ mã 
hoàn toàn hợp lệ, và từ danh sách này tìm ra 2 từ mã có khoảng 
cách Hamming nhỏ nhát. Khoáng cách này là khoảng cách 
Hamming cùa mã đầy đù. 

Đặc tính phát hiện và sứa lỗi cũa một mã tùy thuộc vào khoáng 
cách Hamming. Đê phát hiện c/ lỗi đơn bit, cần một mã có khoảng 
cách ( cỉ + 1 ) bỡi vì với một mà như vậy, sẽ không có cách nào d lỗi 
đơn bit có thè thay đối một từ mã hợp lệ thành một từ mã có giá trị 
không hợp lệ. Tương tự đê sửa d lồi đơn bit cần một mả có khoảng 
cách ( 2d + 1 ) bởi vì bằng cách đó các từ mã hợp lệ có khoảng cách 
xa đen nôi ngay khi có d sự thay đôi, từ mà nguyên thủy vẫn còn 

gân hơn bât kỳ một từ mà nào khác, vì thế được xác đinh là duy 
nhất. 

Xét một thí dụ đơn giản về mã phát hiện lỗi. Một mà có môt bit 
kiêm tra chẵn lẻ đơn^ ( single parity bit ) dược thêm vào dữ lieu. 
Chọn bit kiểm tra chẵn lẻ sao cho tống số số bit 1 trong từ mã là 
chẩn ( kiểm tra chẵn ) hoặc lé ( kiểm tra lẻ ). Một mã như vay co 
khoảng cách là 2 nên khi có bất kỳ một lỗi đơn bit nào xuất hiên 
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cũng sinh ra một từ mã có kết quả kiểm tra chẵn lẻ sai. Cách này 
thường được dùng đế phát hiện các lỗi đơn. Mỗi khi một từ có bit 
kiểm tra chẵn lẻ sai được đọc từ bộ nhớ, trạng thái lỗi sẽ xuât hiện 
và một thao tác đặc biệt được thực hiện. Chương trình không thề 
tiếp tục được nừa, nhưng ít nhất sẽ không có một kết quả sai nào 
được tính toán. 

Bây giờ ta xét một thí dụ đơn giản về mã sửa lỗi. Một bộ mã chỉ 
có 4 từ mã có giá trị : 

0000000000, 0000011111, 1111100000 và 1111111111. Mã này 
có khoảng cách là 5, nghĩa là có thế sửa lồi khi có các lỗi kép í 
double error ). Nếu xuất hiện từ mà 0000000111, máy tính nhận sẽ 
biết mã ban đầu phải là 0000011111 ( nếu không có nhiều hơn một 
lỗi kép ). Tuy nhiên, nếu một lỗi ba ( triple error ) biến đối 
0000000000 thành 0000000111, lỗi sẽ không được hiệu chỉnh đúng. 

Hảy hình dung rằng, ta muôn thiết kế một mâ có m bit dữ liệu 
và r bit kiếm tra cho phép hiệu chinh đúng tất cả các lỗỉ đơn bit. 
Mỗi một từ cùa 2'" từ nhớ hợp lệ sẽ có n từ mả không hợp lệ có 
khoảng cách là 1 so với từ này. Nhừng từ mã này được hình thành 
bằng cách đối có hệ thống từng bit của n bit trong từ mã rt-bit. Với 
mỗi từ của 2"‘ từ nhớ hợp lệ ta cần các mẫu ( n + 1 ) bit. Vì toàn bộ 
số mảu bit là 2", nên ta có ( n + 1 )2 m < 2". Đặt n = m + r, yêu cầu 
này trở thành ( m + r + 1 ) < 2'. Cho biêt /7Ĩ, biểu thức sè có một 
giới hạn dưới trên sô" bít kiểm tra cần thiêt để hiệu chinh các lỗi 
đơn. Hình 2.12 trình bày số bit kiếm tra cần thiết cho những kích 
thước từ nhớ khác nhau. 

Trong thực tế, giới hạn dưới này có thế dạt được theo lý thuyẽt 
bằng cách dùng phương pháp cùa Richard Hamming ( 1950 ). Trước 
khi nghiên cứu thuật toán Hamming, hãy xem một biếu diền đổ họa 
đơn gián minh họa rõ ý tướng về mã sửa lỗi cho các từ nhớ 4-bit. Sơ 
đồ Venn hình 2.13(a) có 3 vòng tròn A, B và c tạo thành 7 vùng 
khác nhau. Thí dụ ta mã hóa từ nhớ 4-bit 1100 trong các vùng AB, 
ABC, AC và BC , cứ 1 bit cho một vùng ( theo thứ tự chữ cái ). Việc 
mã hóa này được trình bày trong hình 2.13(a). 
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Kích thước tử Sỏ bit kitứn tra Kích Ihướe chuiiíỉ IMián tràm 


8 

4 

12 

50 

16 

5 

21 

31 

32 

6 

38 

19 

64 

7 

71 

11 

128 

8 

136 

6 

256 

9 

265 

4 

512 

10 

522 

2 


Hình 2.12 Số bit kiểm Ira cần thiết cho mà sứa lỗi (lơn 


Kè tiếp ta thêm một bít kiểm tra chẵn lẻ vào từng vùng trông 
còn lại đề tạo ra kiếm tra chẵn, như minh họa trong hình 2.13(b), 
tổng sô bit 1 trong mỗi vòng tròn A, B và c là sỏ chẵn, ơ vòng tròn 
A ta có 4 bit 0, 0, 1, 1 và tổng sô số bit 1 là 2 ( sô chẵn ). ơ các 
vòng tròn B và c ta cũng có giống như vậy. 




Hình 2.13 (a) Mà hóa 1100 (b> Thêm vào các bit kiếm tra chần 

(c) Lỗi trong vùng AC 

Trong thí dụ này tât cả các vòng tròn đều giống nhau, nhưng 
tổng số số bit 1 là 0 và 4 cũng có thế xảy ra cho những thí dụ khác. 
Hình vẽ này tương ứng với một từ mà có 4 bit dữ liệu và 3 bit kiểm 
tra chẵn lẻ. 
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Giả sư bit ở trong vùng AC bị sai, đối từ 0 sang 1 như trong hình 
2.13{c), Máy tính sẽ biết ràng các vòng tròn A và c có kiếm tra 
chẵn lẻ sai ( kết quá lẻ thay vì chẵn ). Chi có 1 bit thay đối, đế sưa 
lỗi ta chỉ cần hiệu chinh bit trong vùng AC trớ lại 0. Bàng cách này, 
máy tính có thẽ sứa các lỗi đơn bít trong bộ nhó' một cách tự động. 

Đên đây ta sẽ sử dụng thuật toán Hamming dế xáy dựng các mã 
sửa lỗi cho một từ nhớ có kích thước bât kỳ, Trong một mã 
Hamming, người ta thèm r bit kiểm tra chẵn lé vào một từ m bit để 
tạo nên một từ mà có chiều dài ( m + r ) bit. Các bit được đánh sỏ 
thứ tự bắt đầu là 1, không phải là 0, với bit ờ vị trí 1 là bit đầu tiên 
bên trái. Tất cá các bit có sỏ thứ tự của vị trí là lũy thừa của 2 là 
các bit kiểm tra chẵn lé, Các bít còn lại là các bit dừ liệu. Thí dụ, 
với một từ 16-bit ta cộng thêm 5 bit kiếm tra chán lẻ ( xem hình 
2.12 ) đê’ có từ má 21-bit, các bit ở các vị trí 1, 2, 4, 8 và 16 là các 
bit kiểm tra chẵn lé, các vị trí còn lại dành cho các bit dừ liệu. Giả 
sứ ta sẽ dùng kiểm tra chẵn trong thí dụ này. 

Mồi bit kiếm tra chẳn lé sẽ kiêm tra một số vị trí bit dừ liệu 
riêng rẽ ; bit kiềm tra chẵn lé được chọn sao cho tống sò" số bit 1 ờ 

các vị trí được kiếm tra là số chắn. Các vị trí bit được kiếm tra bới 

* * * 

các bit kiểm tra chẵn lé là : ■ 

Bit 1 kiểm tra các bit ; 1, 3, 5, 7, 9, 11, 13, 15. 17, 19, 21. 

Bit 2 kiểm tra các bit ; 2, 3, 6, 7, 10, 11, 14. i 1I\ 19. 

Bit 4 kiểm tra các bit : 4, 5, 6, 7, 12 1^, xồ, 20, 21. 

Bit 8 kiểm tra các bít : 8, 9, 10, 11, 12, 13, 14, 15. 

Bit 16 kiểm tra các bít : 16, 17, 18, 19, 20, 21. 

Nói chung, bit dừ liệu ở vị trí 6 được kiểm tra bởi các bit kiểm 
tra chẩn lẻ ở các vị trí 6], b-jy ..., 6j sao cho b\ + b 2 + + bj = b . Thí 

dụ, bit 5 được kiếm tra bới các bit kiểm tra chẩn lé 1 và 4 bởi vì 1 + 
4 = 5. Bit 6 được kiểm tra bới các bit kiểm tra chẵn lẻ 2 và 4 vì 2 + 
4 = 6, V.V... . 
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Hình 2,14 biểu diễn câu trúc một mã Hamming cho từ nhớ 16- 
bit 1111000010101110. 001011100000101101110 là từ mã 21-bit. Để 
hiếu cách làm việc của má sứa lỗi, hãy xem điều gì sẽ xảy ra nêu bit 
5 bị nghịch đáo bới một xung điện áp cũa đường câp điện. 

Từ mã mới bây giờ là 001001100000101101110 thay vì 
001011100000101101110. Kiếm tra lại 5 bít kiểm tra chẵn lẻ ta có 
kết qua sau : 

Bit kiểm tra chẵn ỉé 1 sai (1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 
chứa 5 bit 1) 

Bit kiểm tra chẵn lé 2 đúng (2, 3, 6, 7, 10, 11, 14, 15, 18, 19 
chứa 6 bit 1} 

Bit kiêm tra chẩn lé 4 sai (4, 5, 6, 7, 12, 13, 14, 15, 20, 21 
chứa 5 bit 1) 

Bit kiểm tra chần lẻ 8 đúng (8, 9, 10, 11, 12, 13, 14, 15 
chứa 2 bit 1) 

Bit kiểm tra chẵn lé 16 đúng (16, 17, 18, 19, 20, 21 
chứa 4 bit 1) 

Tống số sô bit 1 trong các bit 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 và 
21 phái là số chẵn bới vì ta đang dùng kiểm tra chẵn. Bit sai sẽ là 
một trong các bit đã được kiêm tra bời bit kiểm tra chẵn lé 1. 
Chúng là các bit 1, 3, 5, 7, 9. 11, 13, 15, 17, 19 hoặc 21. Bit kiêm tra 
chẵn lé 4 sai, nghĩa là một trong các bit 4, 5, 6, 7, 12, 13, 14, 15, 20 
hoặc 21 sai. Lỗi sai phái là một trong các bit có trong cá 2 danh 
sách, gồm các bít 5, 7, 13, 15, hoặc 21. Tuy nhiên, bit kiểm tra chẵn 
lẻ 2 đúng nên loại dược bit 7 và 15. Tương tự bit kiểm tra chẵn lẻ 8 
đúng nên loại được bit 13. Cuôi cùng, bit kiểm tra chẵn lẻ 16 đúng 
nên loại được bit 21. Vậy chi còn lại bit 5 sai và do đoc đươc là 1 
nên bit 5 đúng phải là 0. Bằng phương pháp này, ta có thể sửa sai 
các lỗi. 

* 

Đế' đơn gián hơn trong việc tìm bit lồi, trước tiên ta tính toán 
tất cả bit kiểm tra chẵn lẻ. Nếu tất cả đều đúng, không có lỗi nào 
xảy ra. Nếu có nhiều hơn một lỗi, ta cộng tất cá các bit kiểm tra 
chẵn lẻ sai, đếm 1 cho bit kiếm tra chẵn lẻ 1, 2 cho bit kiểm tra 
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chẵn lẻ 2, 4 cho bit kiểm tra chẵn lẻ 4, v.v... Tổng sinh ra chính là 
vị trí của bit lỗi. Thí dụ nếu các bit kiểm tra chẵn lẻ 1 và 4 sai, các 
bit kiểm tra chẵn lẻ 2, 8 và 16 đúng, bit lỗi là bit-ở vị trí 5 vì 1 + 4 
= 5. 


Memory word 1111000010101110 

001011101 0 . 0 , 010.,110 

- - -- --s 17 18 19 20 21 



Parity bỉts 


Hình 2.14 Câu trúc ma Hamming cho từ nhớ 1111000010101110 bằng 
cách thêm 5 bit kiêm tra chẵn lé vào 16 bit dữ liệu 

Memory word : từ nhớ 

Parity bits : các bit kiểm tra chẵn lẻ 

2.2.5 Bộ nhớ chính trong các IBM PC hoặc tương thích 

Các máy tính cá nhân PC ( personal Computer ) ban đầu với các 
chip vi xử lý 20-bit địa chỉ có khả năng địa chỉ hóa một không gian 
bộ nhớ tối đa 1 MB trong đó 640 KB dưới được gọi là vùng nhớ qui 
ước ( conventional memory ), 384 KB trên là vùng nhớ dự trừ cho hệ 
thống hay còn gọi là vùng nhớ cao UMA ( upper memory area ). Sự 
sáp xếp này tồn tại đên bây giờ ngay cả trên các PC sử dụng bộ vi 
xử lý Pentium II, III với số bit địa chỉ lớn hơn nhiều. Bộ nhớ 1 MB 
được chia làm 16 vùng nhớ mỗi vùng 64 KB gọi là một segment ( 
nhớ ) vật lý t để phản biệt với segment logic do ta định nghĩa khi 
lập trình bằng ngôn ngữ hợp dịch ). 

Các scgĩìicĩĩt đươc đánh sô theo so hex tư 0 đen F hay con 
gọi là các segment từ 0000 đến F000 ( chi tiết về vấn đề này được 
bàn đến trong chương 5 và chương 7 ). 640 KB vùng nhớ qui ước bao 
gồm các segment từ 0000 đến 9000 và 384 KB vùng nhớ dự trữ cho 
hệ thống bao gồm các segment từ A000 đến F000. Các chip vi xử lý 
có nhiều bít địa chỉ hơn lần lượt ra dời làm cho không gian bộ nhớ 
tôi đa tăng dần ( 16 M đôi với 286 và 386SX Ị 4 G đôi VỚI 386DX , 
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486, Pentium , Pentium MMX và Pentium Pro ; 64 G đôi với 
Pentium II ). Vùng nhớ lớn hơn 1 M gọi là vùng nhớ mở rộng ( 
extended memory ). Nếu bộ vi xứ lý đang chạy ờ chê độ thực ( real 
mode ), chỉ có 1 M đầu tiên được truy xuất. Ngược lại, nếu bộ vi xử 
lý ở trong chế độ bảo vệ ( protected mode ), toàn bộ không gian nhớ 
đều có thê truy xuất được. 

Một vân đề quan trọng đã xảy ra trong các PC là sự xung đột 
giữa các chip bộ nhớ đọc / ghi RAM ( random access memory ) được 
cài dặt cùng với vùng nhớ dành cho hệ thống, do vậy 384 K RAM 
trùng địa chỉ với vùng nhớ dành cho hệ thống sè bị bó qua ( nghĩa 
là tổng dung lượng bộ nhớ RAM sử dụng được sẽ bằng tổng dung 
lượng bộ nhớ RAM cài đặt trừ đi 384 K ). Phần lớn các PC có 4 M 
RAM ( 4096 K ) được cài đặt cho thấy chí có 3712 K được sử dụng 
bao gồm 640 K cho vùng nhớ qui ước và 3072 K cho vùng nhớ mở 
rộng. Tuy vậy vẫn có các PC chỉ thiếu 128 K thay vì 384 K nhờ vào 
các biện pháp sắp xếp lại bộ nhớ. 

Sự xung đột xảy ra do các segment A000 và B000 được dành cho 
RAM video, các segment cooo và D000 được dành cho bộ nhớ chỉ 
đọc ROM ( read only memory ) và RAM của các board cắm trên các 
khe cắm mơ rộng ( expansion Slot ) của board mẹ ( mother board ), 
các segment E000 và F000 được dành cho bộ nhớ chỉ đọc chứa hệ 
xuất nhập cơ bán ROM BIOS ( basic input output System ) trên 
board mẹ. Điều này có nghĩa là tất cả RAM chiếm nhừng địa chỉ 
này phải bị tắt hoặc các thành phần nêu trên không thực hir ix duưc 
chức năng của mình để tránh xung đột trong vùng ƯMA. 

Các nhà thiết kế board mẹ thường thực hiện các kha năng sau 
để tránh xung đột : 

Sử dụng RAM nhanh hơn đế lưu trừ bán sao của các ROM 
chậm, gọi là tạo cửa số, vô hiệu hóa các ROM này trong xử lý. 

Tắt các RAM không sử dụng tạo cửa sổ nhằm tránh xung 
đột trong vùng ƯMA. 

Sắp xếp lại RAM không được sử dung tạo cửa sổ. 




Chương 2: Tô chức hệ thống máy tính 


Phần lớn các PC tạo cứa sỏ cho ROM BIOS ( thường là 64 K ), 
ROM video ( video ROM ) 32 K. 

RAM dùng cho bộ nhớ chính là RAM động DRAM ( dynamic 
RAM ) và các loại RAM dộng cái tiến như EDO-RAM ( extended 
data out RAM ) và SD-RAM ( synchronous DRAM ) có thời gian truy 
xuât trong khoảng từ 10 nsec đến 200 nsec ( thời gian truy xuất 
càng nhỏ tốc độ hoạt động của bộ nhớ càng nhanh ). EDO-RAM 
hiện đang được sừ dụng trong các hệ thống Pentium, thích hợp với 
các hệ thống bus có tốc độ 66 MHz , trong khi SD-RAM thích hợp 
với các hệ thông bus có tốc độ lên đến 100 MHz và có thể hơn nữa 
trong tương lai. Các chip nhớ RAM hiện nay được ghép thành các 
mõ đun nhớ một hàng chân gọi là SIMM hoặc các mô đun nhớ hai 
hàng chân gọi là DIMM. 

Các SIMM 30 chân có dung lượng 256 K, 1 M, 4 M, 16 M byte 
nhớ ( 8 bit hoặc 9 bít nếu có bit kiểm tra chẵn lẻ ), các SIMM 72 
chân có dung lượng 1 M, 2 M, 4 M, 8 M, 16 M, 32 M và 64 M byte 
nhớ hay 256 K, 512 K, IM, 2 M, 4 M, 8 M, 16 M từ nhớ 32-bit ( 
hoặc 36 bit nếu kế thêm các bit kiếm tra chẵn lẻ ) còn các DIMM 
168 chân có dung lượng 1 M, 2 M, 4 M, 8 M và 16 M từ nhớ 64-bit ( 
hoặc 72 bit nếu kể thêm các bit kiếm tra chẵn lẻ ). 

Ngoài bộ nhớ RAM động, trong các PC còn tồn tại các bộ nhớ 
chỉ đọc ROM lưu các chương trình cố định như ROM BIOS và ROM 
bàn phím hay bộ điều khiển bàn phím. 

ROM BIOS chứa các chương trình thực hiện các chức năng cơ 
bản sau : 

Kiểm tra những thành phần của máy tính khi khởi động 
như : bộ nhớ, board mẹ, board video, bộ điều khiển đĩa, bàn phím và 
những thành phần quan trọng khác của máy tính. 

Tìm và nạp hệ điều hành. 

Cung cấp các chương trình cho bộ vi xử lý đế thực hiện các 
thao tác liên quan đến các thiết bị xuất / nhập. 
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Bộ điều khiển bàn phím thường là bộ vi điều khiển ( micro- 
controller ) 8042 của Intel tích hợp một bộ vi xử lý, RAM, ROM và 
các cổng I/O bên trong. 

2.2.6 Bộ nhớ phụ 

Vì mỗi một từ nhớ trong bộ nhớ chính được truy xuât trực tiêp 
với thời gian rất ngắn, giá thành của bộ nhớ chính tương đôi cao. 
Do đó, hầu hết các máy tính đều có thêm các bộ nhớ phụ tôc độ 
thấp, rẻ hơn và thường có dung lượng lớn hơn nhiều. Bộ nhớ phụ 
thường dùng để lưu trữ các tập dữ liệu lớn hơn so với dung lượng của 
bộ nhớ chính. 

Băng từ 

Về mặt lịch sử, băng từ ( magnetic tape ) là loại bộ nhớ phụ đầu 
tiên, o băng từ của máy tính tương tự như máy ghi băng trong gia 
đình. Băng từ có chiều dài 2400 ft được quấn trên ôlng cho ( feed reel 
), qua một đầu ghi đến ông nhận ( take-up reel ). Bằng cách thay đổi 
dòng điện trong đầu ghi, máy tính có thể ghi thông tin lên băng từ 
ở dạng các vệt từ hóa nhỏ ( magnetized spot ). 

Hình 2.15 trình bày cách tổ chức thông tin trên băng từ. ở một 
máy tính với các byte 8-bit, mỗi khung ( frame ) chứa một byte cộng 
thêm 1 bít phụ ( dư thừa ), gọi là bit kiểm tra chẵn lẻ để cải thiện 
độ tin cậy. Mật dộ ghi tiêu biểu của băng từ ià 1600 khung ( byte ) 
mỗi inch < ký hiệu là 1600 bpi, byte per inch ), nghĩa là 1 khung có 
chiều dài nhỏ hơn 1/1000 inch. Các mật độ thường dùng khác là 800 
bpi và 6250 bpi. 

Sau khi ổ băng từ thực hiện xong việc ghi 1 bản ghi vật lý ( 
physical record ) ( một chuỗi các khung ), 1 khe ( gap ) được để lại 
trên băng từ trong lúc ổ băng từ giảm tốc độ xuống. Nếu chương 
trình ghi các bản ghi ngắn trên băng từ, nhiều khoảng trống sè bị 
bỏ phí ở các khe. Bằng cách ghi các bản ghi dài hơn. các khe nhiều, 
việc sử dụng băng từ sè có hiệu quả cao. 

Băng từ là loại thiết bị truy xuất tuần tự nôi tiếp. Nếu băng từ 
được định vị ở vị trí khới đầu ( đầu từ đang ở đầu băng ), muốn dọc 
bản ghi n, ta phái dọc qua hết các bản ghi từ 1 tới 71-1. Nếu thông 
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tin muôn dọc nằm ở gần cuối băng, chương trình phải đọc hầu như 
toàn bộ băng và mất khoảng vài phút. CPU có thể thực hiện hàng 
triệu chỉ thị mỗi giây, trong lúc băng từ lại làm gia tăng sự lãng phí 
về thời gian. Hầu như băng từ chỉ thích hợp khi dừ liệu dược truy 
xuất tuần tự nôi tiếp. 
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Dlrection of tape motton 


Hình 2.15 Thông tin ghi trên băng từ là một chuỗi các ma trán bit hình 

chử nhật 

Track : track 
Frame : khung 

Inter-record gap : khe giữa 2 bán ghi 
Physical record : bản ghi vật lý 

Direction of tape motion : hướng chuyến động của bâng từ 

Đĩa từ 

Đĩa từ ( disk ) là một lá kim loại hình đĩa có dường kính từ 5 tới 
10 inch được phủ từ trên cả 2 mặt bời nhà sán xuất ( xem hình 2.16 
). Thông tin được ghi trên một số các vòng tròn đồng tâm gọi là 
track. Đĩa có từ khoáng 40 đến vài trâm track mỗi mặt. Mỗi một ổ 
đĩa có một đầu từ di chuyển vào ra được theo đường bán kính. Đầu 
từ có bề rộng đủ để đọc hoặc ghi thông tin lên track một cách chính 
xác. Ổ đĩa thường có nhiều đĩa xếp theo chiều đứng cách xa nhau 
* khoảng 1 inch. Trong cấu hình như vậy, đĩa có một đầu từ tiếp xúc 
với một bề mặt đĩa, những đầu từ này được nối chung với một cần { 
arm ) có thế di chuyển vào ra đồng thời. VỊ trí xuyên tâm của các 
đầu từ ( khoảng cách từ trục ) gọi là cyỉinder. Ô đĩa có n đla { 
platter ) sẽ có 2 n đầu từ và 2 n track mỗi cylinder . 
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Các track được chia thành nhiều scctor, thường khoảng từ 10 
đên 100 sectur mỗi track. Một sector chứa một sô byte nào đó, 
thường là 512 byte. 



(a) 



Hình 2.16 (a) o đĩa có một dĩa (b) Ỏ đĩa có 4 đĩa 

spindle : trục 
Sector : sector 
Arm : cần 

Rotating shaft : trục quay 
Surtace : bề mặt 

Read / write heađ ( 1 per suríace ) : đầu đọc / ghi ( 1 / bề mặt ) 

Directìon of arm motion : hướng di chuyền cũa cần 

Để chỉ rõ một thao tác truy xuất đĩa, chương trình phải 
cung cấp những thông tin sau : cyỉỉnder và đầu từ ( cả 2 định rõ 
một track duy nhất ), sector nào ờ đó thông tin bắt đầu , số lượng từ 
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dược truyền đi, địa chi bộ nhớ chính nơi thông tin đến hoặc đi 
và thông tin được đọc từ đĩa vào bộ nhớ hay được ghi từ bộ nhớ lẻn 
đĩa. 


Các thao tác truy xuát đĩa luôn bắt (lẩu ơ dầu một sector, khỏng 
bao giờ ờ giừa. Nêu phái truy xuảt nhiều scctor qua ranh giới cùa 
track trong cùng một cylindcr ( nghĩa là từ mặt 0 sang mật 1 ớ cùng 
vị trí cùa cần nôi đầu từ), ta sẽ không mát thời gian bới vì việc 
chuyên từ đầu từ này sang đầu từ khác được thực hiện bằng điện tứ. 
Tuy nhiên, nêu truy xuảt qua ranh giới cùa cyỉindcr, phái mất thời 
gian quay trong khi định vị lại các đầu từ cho cyhnder kê tiêp và 
đợi cho sector 0 quay trớ lại. 

Nêu đầu từ được định vị trên một cyỉindcr sai, trước tiên đầu từ 
phải di chuyến. Sự di chuyến này gọi là tìm kiếm ( seek ). Mồi lần 
tìm kiếm sẽ mât 3 msec giữa các trách kế cận nhau, và mất từ 20 
tới 100 msec để di từ cyỉindcr trong cùng đến cyỉindcr ngoài cùng. 
Khi đầu từ đả ở dúng vị trí, bộ điều khiển phái đợi cho tới khi sector 
đầu tiên quay dưới đầu từ trước khi bắt đầu truy xuất. Thời gian đợi 
( bị bó phí ) đè quay tới scctor đúng thay đối từ 0, nếu chương trình 
gặp may, đến hết toàn bộ thời gian quay. Thời gian đợi này gọi là 
thời gian trề luân phiên í rotational latency ). Đa số các đĩa đều 
quay với vận tôc 3600 vòng / phút nên thời gian trễ cực dại là 16.67 
msec. Thời gian truy xuất tổng cộng chính là thời gian tim kiếm 
cộng với thời gian trễ luân phiên và thời gian truy xuất. Thông tin 
được truyền ớ tốc độ là 1 track cho mỗi chu kỳ quay. 

Gần như tất cá các máy tính đều sứ dụng ố đĩa có nhiều đĩa như 
mô tá ở trên dể lưu trừ các dừ liệu quan trọng. Những đĩa này 
thường gọi là đĩa cứng ( hard disk ). Loại thường dùng nhất là đĩa 
vvinchester ( sử dụng từ thập niên 60 ). Đĩa được bịt kín ( đế tránh ô 
nhiễm do bụi ). Các đầu từ trên đĩa winchester được định dạng theo 
phương pháp khí động lực học và lơ lững trẽn một đệm khí tạo ra do 
sự quay tròn cùa đĩa. Dung lượng của dĩa khoáng 20 megabyte ( MB 
) đối với các máy tính cá nhân PC tới khoảng 10 gigabyte ( GB ) 
trên các mainírame lớn. 
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Từ những năm đầu của thập niên 80 đến nay, các ổ đĩa cứng 
dùng trong các PC đã có nhiều thay đổi tiến bộ : . 

Dung ỉượng 10 MB, kích thước 5 X Á inch vào năm 1982 được 
nâng lên 10GB hoặc hơn với kích thước 3 Vỉ. inch hiện nay. 

Tốc độ truyền dữ liệu tăng từ khoảng 100 KB / sec ( ở máy 
IBM PC chuẩn vào năm 1983 ) đến gần 10 MB / sec cho các ổ đĩa 
cứng nhanh nhất hiện nay. 

Thời gian truy tìm trung bình từ khoảng 80 msec ở máy 
IBM PC chuẩn giảm xuống còn dưới 8 msec đốì với các ố đĩa cứng 
tốc độ cao. 

Dữ liệu nhị phân dưới dạng các chuỗi bit 0, 1 ( dạng thô ) không 
được ghi trực tiếp lên đìa. Thay vào đó người ta mã hóa chúng, 
nghĩa là chuyến đôi dữ liệu nhị phân thô thành chuỗi xung và ghi 
lên đĩa. Việc chuyến đổi này nhằm phù hợp với việc đảo chiều cực 
tính các vùng từ tính trẽn đĩa khi có sự thay đổi chiều dòng điện 
trên đầu ghi. Khi đọc dữ liệu trên đĩa, quá trình giải mã chuồi xung 
sẽ diễn ra để ta có lại dữ liệu nhị phân thô ban đầu. Thiết bị làm 
công việc mã hóa và giải mã được gọi là bộ mã hóa / giải mã 
ENDEC ( encoder - decoder ). Có nhiều phương pháp mã hóa khác 
nhau đã dược thứ nghiệm nhưng cho dến nay chỉ còn vài phương 
pháp phổ biến. Các phương pháp này là : điều chế tần sô' FM ( 
írequency modulation ), điều chế tần sô' thay đổi MFM ( modiíied 
ữequency modulation ) và mã hóa độ dài chạy có giới hạn RLL ( ■ 
Run Length limited ). 

Đĩa mềm 

Với sự xuất hiện của máy tính cá nhân, người ta cần có một 
phương pháp đề phản bố phần mềm. Giải pháp được tìm thấy là đĩa 
mềm ( diskette hoặc íloppy disk ), đây là một phương tiện nhỏ gọn, 
có thể di chuyển được, như tên gọi của nó. Thực ra các đĩa mềm 
được công ty IBM phát minh nhằm để lưu giữ thông tin bảo trì của 
các mainírame, nhưng chúng đã nhanh chóng được các nhà chế tạo 
máy tính cá nhân chiếm lĩnh và sử dụng như là một phương tiện 
thuận lợi để phân phối các phần mềm của họ. 
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Không như các đĩa vvinchester, các đầu từ của đĩa cứng lơ lửng 
trên bề mặt đĩa ở khoảng cách vài micron, đầu từ cúa đìa mềm thực 
sự tiếp xúc với bề mặt đĩa. Do vậy, môi trường tiếp xúc cùa bề mặt 
đĩa và đầu từ sẽ bị hao mòn tương đối nhanh. Để làm giảm sự hao 
mòn này, trong các máy tính cá nhân, người ta rút đầu từ lên trên 
và ngừng quay đĩa khi ố đĩa không đọc hoặc ghi thông tin. Do đó, 
khi có chỉ thị đọc hoặc ghi thông tin kê tiếp, sẽ có thời gian trề 
khoáng nửa giây đề mô-tơ tăng tốc độ. 

Ngày nay, có 2 kích thước đla được sử dụng : 5.25 inch và 3.5 
inch. Cả hai đều có các phiên bán dung lượng cao và thấp. Các đĩa 
3.5 inch có một vỏ cứng bảo vệ, vì thế chúng không thực sự là đĩa 
mềm. Do đĩa 3.5 inch chứa nhiều dừ liệu hơn và được bảo vệ tốt 
hơn, nên dần dần đã thay thê đĩa 5.25 inch. Các thông sô quan 
trọng của 4 loại đĩa ( theo kích thước ) dược trình bày trong hình 
2.17. 


Kích thước ( inch ) 

5.25 

5.25 

3.5 

3.5 

Dung lượng t byte > 

360 K 

1.2 M 

720 K 

1.44 M 

SỐ trách 

40 

80 

80 

80 

Sô sector / track 

9 

15 

9 

15 

Sỏ dầu từ 

2 

2 

2 

2 

Sô* vòng quay / phút 

300 

360 

300 

300 

Tốc dộ dữ liệu ( kbps ) 

250 

500 

250 

500 


Hình 2.17 So sánh 4 loại đĩa mồm 

Các đĩa mềm có 2 đầu từ, nghĩa là đỉa mềm có 2 mặt. Tốc độ 
quay của đĩa mềm khoảng 300 đến 360 vòng / phút để không tạo ma 
sát mạnh. Các đĩa mềm mới hiện nay được phủ lớp Teílon hoặc 
những hợp chất khác nhằm giảm sự ma sát và cho phép đĩa lướt 

nhẹ nhàng. 

Hãng Toshiba cùng đã sản xuất các ổ đĩa mềm dung lượng 2.88 
MB, kích thước 3 Vi inch vào nám 1987 và sử dụng trong các hệ 
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thống PS/2. Các phiên bán DOS 5.0 trớ lên đâ hỗ trợ cho loại đĩa 
niềm này. 

Các ỏ đìa mềm đẻu sứ dụng phương pháp mã hóa MFM khi đọc 
và ghi dử liệu trên dĩa mềm. 

Đĩa quang 

Vào những năm gần đây, các đĩa quang ( optical disk ) ( khác với 
đĩa từ ) đã được đưa vào sứ dụng. Các đìa quang có mật độ ghi thông 
tin cao hơn nhiều so với các đỉa từ thông thường. Ban đầu đĩa quang 
được triển khai đẽ ghi các chương trình truyền hình, nhưng rồi 
chúng cũng được dùng làm các thiết bị lưu trừ của máy tính. Tín 
hiệu truyền hình có băng thông 6MHz nén một đĩa quang 1-giờ theo 
lý thuyết có dung lượng khoảng 10 Gbit. Các hệ thống trên thực tế 
chỉ nhận được một nữa. ( Băng thông là một thuật ngừ kỹ thuật 
điện, được xem như là khá nàng mang thõng tin của một kênh tín 
hiệu. Băng thông 1 Hz thường tốt cho việc truyền 1 bit / sec ). 

Do khả năng chứa thông tin rất lớn nén đĩa quang là đỏi tượng 
cua rất nhiều đề tài nghiên cứu và được phát triển cực nhanh. Các 
đĩa quang đầu tiên được sáng chế bỡi một tập đoàn điện từ của Hà 
Lan là Philips và được phát triển thêm với sự hợp tác của Sony. Các 
đĩa quang này dựa vào công nghệ dã dùng trong máy quay đĩa âm 
tần Compact Disc và được gọi là CD ROM t Compact Disc Read Only 
Memory ). 

Đĩa CD ROM được chế tạo bằng cách dùng một tia laser có công 
suất cao đề đốt cháy các lỗ có kích thước 1 micron { 10' 6 m ) trêrí 
một đĩa chù ( master disk ). Từ đĩa chú này người ta tạo được một 
khuòn dùng làm mẫu đế tạo những bán sao trên các đĩa plastic, các 
đĩa của máy hát đìa cũng chế tạo với cùng phương pháp như vậy. 
Kế đến một* lớp nhôm móng được phú lên bề mặt và tiếp theo là 
một lớp plastic bảo vệ trong suốt. Thiết bị dùng để đọc đĩa CD 
ROM cũng tương tự với máy quay đĩa CD, có một bộ phân tích đo 
năng lượng phản xạ từ bề mặt khi có một tia Iaser công suất thấp 
phát tới bề mặt. Các lỗ, dược gọi là pit và nhừng vùng không bị đốt 
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cháy giữa các pit, gọi là land, sẽ có sự phản xạ khác nhau giúp ta 
phân biệt giữa pit và land. 

Kỹ thuật này có nhiều hệ quả quan trọng. Thứ nhất, do các đĩa 
CD ROM được dập khuôn, không ghi thông tin như các đĩa mềm 
thông thường và được chế tạo hàng loạt bằng máy tự động theo một 
khuôn mầu sần nên giá thành rất thấp. Thứ hai, do đĩa plastic có 
bao phú một lớp nhòm được dập theo khuôn nên sẽ không thật 
chính xác, thòng tin số trên đĩa thường chứa nhiều lỗi. 

Vấn đề lỗi được xử lý bằng 2 cách. Trước tiên, đầu đọc trong ổ 
đìa có một gương chính xác được diều khiển bới một cơ cấu trợ động 
( một bộ máy để điều khiển một cỗ máy lớn hơn ), dùng theo dòi bề 
mặt đĩa nhằm bù lại sự khỏng hoàn hảo khi chẽ tạo. Thứ hai, dừ 
liệu được ghi lẽn dĩa dùng một phương pháp mả hóa phức tạp gọi ià 
mả sứa lỗi xen kẽ ( cross-interleave ) Reed-Solomon. Phương pháp 
mả hóa này dùng nhiều bit hơn mã Hamming đê có thế' sữa nhiều 
lỗi. 

Hơn nữa, thay vì biểu thị pit là 0 và ỉand là 1 ( hoặc ngược lại ), 
người ta biểu thị cho mỗi lần chuyến tiêp pit-land hoặc land-pit là 1. 
Khoảng cách giữa 2 lần chuyến tiêp cho biêt có bao nhiêu bit zero 
giữa các bit 1. Dữ liệu được ghi thành các nhóm 24 byte, mỗi nhóm 
được mớ rộng thêm từ 8 đến 14 bit bàng cách dùng mã Reed- 
Solomon. Thêm 3 bit dặc biệt vào giừa mồi nhóm vá thèm một byte 
dồng bộ đế tạo thành một khung ( frame ). Một nhóm 98 khung tạo 
thành một khối ( block ) chứa 2Kbyte dữ liệu. Khối là đơn vị cơ bản 
được địa chí hóa. Mặc dù phương pháp này phức tạp và tốn một 
vùng đĩa đáng kể nhưng lại cho ta độ tin cậy rất cao với vật liệu sử 
dụng có giá thành thấp. 

Thông tin trên CD ROM được ghi theo dạng xoắn ốc liên tực, 
không giống như đĩa từ theo các cylỉnder và track riêng biệt. Khuôn 
dạng này được minh họa trong hình 2.18. Moi CD ROM chưa 
270000 khối dừ liệu với tổng dung lượng là 553 megabyte. Dữ liệu 
được đọc ớ tốc độ tuyến tính không dổi là 75 inch / sec ( nghĩa là tốc 
độ quay giám dần theo hướng đầu dọc di chuyến ra ngoài ) và cho 
tốc độ truy xuất dữ liệu là 153.60 Kbyte / sec. 
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Hình 2.18 Khuôn dạng của một CD ROM 

Spiral groove : đường rãnh xoắn ốc 
Pit : pit 
Land : land 

2 K block of User đata : khôi dữ liệu 2 K cùa người sử dụng 

CD ROM có tiềm năng sử dụng cao trong việc phân phôi các 
nguồn dữ liệu có dung lượng lớn, đặc biệt với những nguồn dữ liệu có 
sự pha trộn giữa văn bản và hình ảnh. Một tủ sách bao gồm 250 
quyển sách dày về luật học, y học hoặc văn học có thể cất giữ dễ 
dàng trên một đìa CD ROM và được xem như một bộ sách bách 
khoa toàn thư. Máy tính trợ giúp tiên trình dạy bao gồm hàng ngàn 
slide màu, mỗi slide kèm theo một tường thuật dài 10 sec cũng được 
chứa trên một CD ROM. Bán đồ về hệ thống tàu bè qua lại của một 
bang có bộ tống hợp tiếng nói hướng dẫn tài công cũng được chứa 
trên một CD ROM. Khả năng sử dụng chỉ bị giới hạn bởi óc sáng 
tạo của con người. 

Mặc dù tiềm năng sử dụng rất lớn nhưng CD ROM lại không 
cho phép ghi, làm hạn chế lợi ích của một thiết bị lưu trữ đối 
với máy tính. Mong muốn có một vật dụng có thể ghi được dă dần 
đến thời kỳ kế tiếp của đĩa quang, đìa WORM ghi một lần đọc nhiều 
lần ( Write Once Read Many ). Đĩa này cho phép người sử dụng tự 
ghi thông tin lên đĩa quang. Tuy nhiên, khi một pit đâ bị đốt cháy 
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trên bề mặt, ta không thể xóa được. Những đĩa như vậy tốt cho việc 
lập các văn thư lưu trừ dừ liệu, việc kiểm tra các sổ sách kê toán và 
những thông tin khác có tính bán thường xuyên. Chúng không thích 
hợp với việc tạo và xóa các tập tin nháp tạm thời. Tuy nhiên, với 
dung lượng lớn của nhừng đĩa này, việc cắt và đốt các tập tin tạm 
thời vừa nôi vào cho tới khi đĩa đầy rồi bỏ đi là điều có thế chấp 
nhận được. 

Rõ ràng sự hiện diện cua các đìa ghi một lần có ảnh hướng lớn 
đẽn cách ghi các phần mềm. Không thế thay đổi các tập tin theo 
hướng đề nghị một loại hệ thông tập tin khác, trong đó tập tin thực 
sự là một chuỗi các phièn ban không biến đối ( immutabỉe version 
), không có tập tin nào bị thay đối và mỗi tập tin thay thê tập tin 
trước đó. Mô hình này hoàn toàn khác với mô hình thông dụng cập 
nhật tại chỗ ( update-in-place ) sử dụng trên đĩa từ. 

Sự phát triển đĩa quang ớ giai doạn 3 là các phương tiện quang 
có thế xóa được bằng cách dùng kỹ thuật quang-từ { magneto-optical 
). Đĩa plastic được bao phủ một hồn hợp kim loại có nhiều chất lạ 
như terbium và gadoỉinium, chúng là các chất ít người biêt đến. Các 
kim loại này có tính chất đáng quan tâm là ớ nhiệt độ thấp chúng 
không nhạy cám với từ trường, nhưng ỡ nhiệt độ cao, câu trúc phân 
tứ cúa chúng tự sắp thẳng hàng theo bất cứ hướng từ trường nào 
hiện có. 

Người ta sử dụng tính chất này đê ghi thông tin, các đầu đọc cúa 
ố đĩa bao gồm một bộ phát tia ỉaser và một nam châm. Bộ phát tia 
laser bắn ra một xung ánh sáng cực ngắn vào kim loại, tức thời làm 
gia tàng nhiệt độ nhưng không tạo thành một pit trên bề mặt. Đồng 
thời nam châm cũng phát ra một từ trường theo 1 trong 2 hướng. 
Khi xung laser hết, kim loại dã dược từ hóa có thế ờ 1 trong ẳ 2 
hướng, biếu thị là 0 hoặc 1. Thông tin nay có thế dọc theo cùng cách 
như với CD ROM, bằng cách dùng một tia laser có bức xạ yếu hơn 
nhiều. Đĩa này cũng có thế xóa và ghi đè lên giống như cách đã ghi 
lần đầu. 

Các đĩa quang ghi được, rất có thể không thay thế các đĩa 
winchester thông thường trong một khoảng thời gian { có lẽ là 
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nhiều nãm ) vì 2 lý do : thời gian tìm kiếm ( seek time } dữ liệu và 
tôc độ truyền dữ liệu ( data rate ) chậm hơn so với các đĩa 
vvinchester. Đồng thời, đặc tính tổng thế của các đĩa từ cũng tốt hơn 
nhiều. Trong lúc đĩa quang chắc chắn sẽ phải cải tiến về thời gian 
tìm kiếm và truy xuât dữ liệu, đĩa từ cũng phải cái tiên hơn nữa đế 
vẫn giữ vị trí hàng đầu. Tuy nhiên, đỏi với các ứng dụng yêu cầu 
một lượng lớn dử liệu lưu trữ có thể di chuyển được, các đĩa quang có 
thê vượt lên một tương lai sáng súa. 

2.3 XUẤT / NHẬP 

Trước khi tiến hành giải quyết một bài toán, máy tính phải được 
cung cấp chương trình và dữ liệu. Sau khi tìm ra được giẩi đáp, máy 
tính phái truyền giái dáp này cho người đặt ra bài toán. Vân đề lấy 
thông tin vào máy tính và đưa thóng tin ra khói máy tính được gọi 
là xuất / nhập ( output / input ) hoặc thường gọi là I/O. 

Không phải tất cả thông tin xuâT nhập đều được dự định dành 
cho con người. Một kính thiên vân mặt trời hoạt động nhờ máy tính 
có thế trực tiếp nhập dữ liệu từ các thiết bị quan sát mặt trời. Một 
máy tính điều khiên một thiết bị hóa học tự dộng có thế trực tiếp 
xuất dừ liệu tới các máy qua thiết bị đế diều hòa các chất hóa học 
được sinh ra. 

Có 2 cách tô chức I/O thường sứ dụng trong các máy tính hiện 
nay. Các mainírame lớn sứ dụng thiết kế được trình bày trong hình 
2.19. Trong thiết kế này, một hệ thông máy tính bao gồm 1 CPU ( 
hoặc có thể nhiều CPU ), 1 bộ nhớ và 1 hoặc nhiều bộ xử lý I/O ( 
I/O processor ) gọi là các kênh dữ liệu ( data channel ). Tất cả các 
thiết bị I/O đều được nối với các kênh. 

Khi muốn thực hiện xuất / nhập, CPU nạp 1 chương trình đặc 
biệt vào một trong các kênh và yêu cẩu kênh đó thực hiện. Kênh sè 
tự điểu khiển tất cá các công việc xuất / nhập tới và từ bộ nhớ đế 
CPU tự do làm nhừng việc khác. Khi thực hiện xong, kênh gởi tới 
CPU một tín hiệu đặc biệt gọi là ngắt ( interrupt ) để buộc CPU 
ngừng bất cứ diều gì đang làm và chú ý đến kênh đó. Thuận lợi của 
cách tổ chức này là cho phép CPU hoàn toàn không quan tâm đến 
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công việc giữa thiết bị 1/0 với kênh. Bàng cách này ta có thề thực 
hiện việc tính toán và xuất / nhập cùng một lúc. 



Hình 2.19 Cấu trúc I/O cùa một mainữame lún 

Ma in memory : bộ nhớ chinh 
Memory bus : bus bộ nhớ 
CPU : dơn vị xứ lý trung tám 
I/O bus : bus xuất / nhập 

I/O processor ( channel ) : bộ xứ lý I/O ( kênh ) 

Terminal Computer : máy tính đầu cuôi 
Printer : máy in 
Disk : dĩa 

Vì các mainírame tao ra mọt tai xuat / nhạp lât. lơn, nen chung 
thường được trang bị ít nhất 3 bus. Bus bộ nhớ ( memory bus } cho 
phép các kênh đọc và ghi các từ dữ liệu ( data word ) từ bộ nhớ. Bus 
1/0 cho phép CPU phát các lệnh tới các kênh và cho phép các kênh 
ngắt CPU. Cuối cùng, bus thứ 3 cho phép CPU truy xuất bộ nhớ mà 
không phải dùng tới những bus khác. 

Các máy tính cá nhân dùng một cấu trúc hệ thống đơn giản 
hơn, như minh họa trong hình 2.20. Hầu hết các máy tính này đều 
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có một khung chứa các card ( card cage ) với 1 board mạch in lớn ở 
dưới gọi là board mẹ ( mother board ). Board mẹ chứa một chip 
CPU, bộ nhớ và các chip hỗ trợ khác. Board cũng chứa 1 bus được 
khắc dọc theo chiều dài và các dế cắm ( Socket ) ớ đó các đầu nôi ( 
connector ) của các board I/O và các bộ nhớ bổ sung được chèn thêm 
vào. Cấu trúc của máy tính mini cũng tương tự, chi khác là CPU 
được đặt trên một plug-in board, với board mẹ chỉ là một nơi chứa 
thụ động cho những board khác, gọi là backpỉanc. 



I/O controller board 
1/0 controller 

Memory board 


Edge connector 


Card cage 


Hình 2.20 Cấu trúc vặt lý cứa một máy tính cá nhân 

ĩ/0 controller board : board điều khiến xuất / nhập 
Memory boarcl : board bộ nhớ 
Edge connector : đầu nối có gờ 
Card cage ; khung chứa các card 

Câu trúc logic cúa máy tính cá nhàn được trình bày trong 
hình 2.21. Hầu hết các máy tính cá nhân chi có 1 bus gọi là bus 
hệ thống ( System bus ) dùng đề' kết nối CPU, bộ nhớ và các thiết bị 
1/0. Mỗi thiêt bị 1/0 có 2 phần, một phần chứa các mạch điện tử gọi 
là bộ điều khiến { controller ), phần kia chứa chính các thiết bị 1/0 
như ô’ đìa chắng hạn. Bộ điều khiển thường được dặt trên một board 
cắm trên khung, trừ các bộ điều khiến không tùy chọn ( như bàn 
phím ), thường được đặt trên board mẹ. Mặc dù màn hình không 
phải là thiết bị tùy chọn, nhưng bộ điều khiển màn hình 
thường được dặt trên một plug-in board cho phép người sử áime 
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chọn lựa các tiêu chuẩn về màn hình: màu, đơn sắc, độ phân giải 
cao, hoặc thấp v.v... . Bộ điều khiển nôi với thiết bị bằng một sợi 
cáp gắn với một đầu nôi ở phía sau khung. 
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Hình 2.21 Câu trúc logic cũa một máy tính cá nhân. 

CPU : đơn vị xứ lý trung tâm 
Memory : bộ nhở 

Video controller : bộ điều khiển video 
Monitor : màn hình 

Keyboard controller : bộ điều khiến bàn phím 
Keyboard : bàn phím 

Floppy disk controller : bộ điều khiến đĩa mềm 
Floppy disk drive : ồ đĩa mềm 
Hard disk controlìer : bộ điều khiển dĩa cứng 
Hard disk drive : ổ đĩa cứng 

Công việc của bộ điều khiển là điều khiển thiết bị I/O và điều 
khiển truy cập bus. Khi muốn truy xuất dừ liệu từ đĩa, chương trình 
phát lệnh tới bộ điều khiển đĩa, sau đó phát lệnh tìm kiếm và 
những lệnh khác tới ổ đĩa. Khi xác định đúng track và sector, ổ đĩa 
bắt đầu xuất dữ liệu theo một chuỗi bit nổi tiếp tới bộ điều khiển. 
Công việc của bộ điều khiển.là cắt các chuỗi bit thành các từ và ghi 
tCfng từ vào bộ nhớ. Việc điều khiển đọc hoặc ghi một khối dữ liệu 
từ hoặc tới bộ nhớ mà không có sự can thiệp của CPU được gọi là 
truy xuất bộ nhớ trực tiếp ( direct memory access ) viết tắt là DMA. 
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Bus không chỉ được dùng bới các bộ điều khiến 1/0 mà còn bới 
CPU đề tìm-nạp các chỉ thị và dữ liệu. Điều gì sẽ xảy ra nêu CPU 
và bộ điều khiển I/O đồng thời muốn sứ dụng bus? Câu trá lời là, 
người ta dùng một chip gọi là bộ phân xữ bus ( bus arbiter ) đê 
quyết định ai sè là người kẻ tiếp được sứ dụng bus. Nói chung, các 
thiết bị I/O được cho quyền ưu tiên cao hơn CPU, bới vì ồ đĩa và các 
thiết bị di chuyên dừ liệu khác không thê bị cắt ngang công việc, 
việc bắt chúng phải đợi sẽ dẫn đến kết quả dữ liệu bị mãt. Khi 
không có thiết bị I/O nào làm việc, CPU có thế lây tât cả các chu kỳ 
bus đế tham khảo bộ nhớ. Tuy nhiên, khi có một. thiêt bị I/O dang 
chạy đồng thời, thiết bị đó sẽ yèu cầu và được cấp bus khi cần đên. 
Quá trình này được gọi là ăn cắp chu kỳ ( cycle stealing ) và làm tỏc 
độ máy tính chậm lại. Như chúng ta thảy, vì các mainírame có 
nhiều bus nên không bị xáy ra trường hợp này. 

Ngày nay người ta đã sứ dụng nhiều loại thiết bị I/O. Một vài 
thiết bị I/O phố biến được bàn đến dưới đây. 

2.3.1 Thiết bị đầu cuối 

Các thiết bị đầu cuối ( terminal ) chuân cứa máy tính gồm có 3 
loại : bàn phím, màn hình và một số mạch điện tứ điều khiển khác. 

Bàn phím 

Bàn phím có nhiều loại khác nhau. Với loại rẻ nhất, mỗi phím 
đơn gian chí là một chuyển mạch ( svvitch ) đê tạo ra một tiếp xúc 
về diện khi ấn phím. Với loại đắt tiền hơn, dưới mồi phím có một 
nam châm đi qua 1 cuộn dây khi gõ phím, vì vậy một dòng điện cám 
ứng được nhận biết. Có nhiều phương pháp khác nhau, cả loại cơ khí 
lẫn điện từ, đều được sứ dụng trong một sỏ' bàn phím. 

Ngoài loại chuyền mạch cơ khí, các bàn phím hiện nay còn sử 
dụng loại chuyến mạch bằng tụ điện có ưu điểm chông mòn và bụi 
bám. Chuyểu mạch có 2 bản bằng nhựa nối thành ma trận chuyển 
mạch được thiết kế đế phát hiện nhừng thay đổi về điện dung của 
mạch. Khi ấn phím, bán trên di chuyến so với bản dưới cố định làm 
điện dung thay đổi. Loại chuyển mạch này không dựa vào tiếp xúc 
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băng kim loại nên tránh được mòn và bụi, cũng như không bị kẹt 
phím. 

Bàn phím trong hệ thống IBM PC và tương thích ban đầu thực 
chát là một bộ xử lý bàn phím truyền thông với máy tính bằng một 
liên kêt dừ liệu riêng biệt nhằm truyền nối tiếp những khung 11-bit 
{ 8 bit dữ liệu và các bit điều khiển ) nhưng không theo chuẩn RS 
232 c. Bộ xứ lý bàn .phím là chip vi điều khiển 8048 hoặc 8049 hoặc 
các chip tương thích như 6805 cùa Motorola. Bộ xử lý dọc ma trận 
phím, giải mã các tín hiệu ấn phím, chuyển đối mã vị trí cúa phím 
thành má quét ( scan code ) rồi truyền đến board mẹ cùa máy tính. 

Trong các IBM PC chuẩn và tương thích, cáp bàn phím được nối 
đên chip giao tiêp ngoại vi lập trình được ( programmable 
peripheral interface ) 8255A trên board mẹ. Chip 8255A nhận dừ 
liệu từ bàn phím truyền đến CPU của board mẹ và tạo ra ngắt IRQ1 
đẽn chip diều khiên ngắt INTC ( interrupt controller ) trên board 
mẹ. Tín hiệu ngắt IRQ1 làm cho CPU chạy một trình phục vụ ngắt 
bàn phím đê phiên dịch mà quét cũa bàn phím và quyết định công 
việc phải làm. 

Trong các IBM PC AT, bộ vi điều khiển 8048 trên bàn phím 
truyền dữ liệu đến bộ điều khiến bàn phím ( thường là chip 8042 ) 
trên board mẹ. Khi chip điều khiển trên board mẹ nhận dược yéu 
cầu từ bàn phím, chip này phát tín hiệu yêu cầu ngắt trên đường 
IRQl và truyền dừ liệu từ bàn phím vào CPU của board mẹ như ờ 
các IBM PC chuẩn. 

Với vai trò trung gian giữa bàn phím và máy chính, chip 8042 
phiên dịch các mã quét cùa bàn phím và thực hiện nhiều chức năng 
khác. Hệ thông còn có thê truyền các chỉ thị đến và đọc các trạng 
thái cúa bộ điều khiển bàn phím 8042 trên board mẹ. Các IBM PC 
AT và tương thích hiện nay còn sứ dụng 8042 diều khiển dòng địa 
chí bộ nhớ A20, điều khiển truy xuất bộ nhớ hơn 1 M. 

Với các máy tính cá nhân cúa IBM và tương thích, các kiểu bàn 
phím sau đây đã lần lượt được sử dụng : 
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Bàn phím PC chuẩn 83 phím 

Bàn phím PC AT 84 phím 

Bàn phím tăng cường 101 phím hoặc 102 phím 

Bàn phím Windows 104 phím 

Màn hình 

Màn hình chủ yếu bao gồm một đèn tia âm cực CRT ( cathode 
ray tube ) và các nguồn cung câp điện. CRT chứa một súng bắn một 
chùm tia điện tử dập vào màn huỳnh quang đặt ờ phía trước đèn, 
như trong hình 2.22(a) { các màn hình màu có 3 súng điện tử tương 
ứng với 3 màu đỏ, xanh lá và xanh dương ). Trong thời gian quét 
ngang, chùm tia điện tứ quét qua màn hình trong một thời gian 
khoáng 50 microsec và vạch ra một đường gần như nằm ngang trên 
màn hình. Kế đến chùm tia điện tứ thực hiện một đường hồi ngang 
trờ về cạnh bên trái để bát đầu lần quét kế tiếp. Thiết bị tạo ra 
hình ảnh theo từng dòng như vậy gọi là thiết bị quét mành ( raster 
scan ). Nếu đường hồi ngang không xáy ra tức thời, người ta gọi là 
boustrophedonic ( cách mà con trâu cày một manh dất từ trái sang 
phái rồi từ phái sang trái, chúng không cày ngược tức thời trong cả 
2 trường hợp ). 

Tia quét ngang dược điều khiến bời một điện áp tăng tuyến tính 
đưa đến các phiến làm lệch ngang đặt ở bên trái và bên phải súng 
diện tứ. Việc quét dọc được điều khiển bới một điện áp tuyến tính 
tăng chậm hơn nhiều đưa đến các phiến làm lệch dọc đặt ở phía 
trên và phía dưới súng diện tử. Sau 400 đến 1000 lần quét, điện áp 
trên các phiến làm lệch dọc và ngang được nghịch đảo cùng lúc đê 
đặt chùm tia điện trờ về góc phía trên bên trái của màn huỳnh 
quang. Toàn bộ ảnh thường được quét lập lại từ 30 tới 60 lần trong 
1 giây. Sự di'■chuyển chùm tia điện tử được trình bày trong hình 
2.22(b). 

li 

Người ta dùng một cực lưới ( grid ) trong CRT để tạo ra một 
mẫu quét gồm nhiều điểm ( dot ) trên màn hình. Khi có một điện 
áp dương đưa tới cực lưới, các điện tử được tăng tốc làm cho chùm 
tia điện tử đập vào màn hình và phát sáng. Khi có điện áp âm đưa 




Chương 2: Tố chức hệ thông máy tính 



tới cực lưới điện tử bị đẩy lùi, vì vậy không qua lưới và màn hình 
không phát sáng. Như vậy điện áp dưa tới cực lưới làm cho có mẫu 
bit tương ứng xuất hiện trên màn hình. Cơ chế này cho phép một 
tín hiệu điện được biến dổi thành tín hiệu có thể hiển thị được ( 
visual display ). 


Grid 



Vertlcal 

deAectlon 

plate 


(a) 


Horlzontal scan 



Vertical retrace Horlzontal retrace 
(b) 


Hình 2.22 (a) Phần cắt ngang cùa mộl CRT (b) Mau quét màn hình CRT 

Electron gun : súng điện tử 
Grid : cực lưới 
Screen : màn hình 

Spot on screen : đốm sáng trên màn hình 
Vacuum tube : đèn chân không 
Vertical deílection plate : phiên lệch dọc 
Horizontal scan : đường quét ngang 
Verticaì retrace : đường hồi dọc 
Horizontal retrace : đường hồi ngang 

Đèn CRT hiện nay có 2 kiểu, kiểu cong và kiểu phẳng. Kiểu màn 
hình cong có mặt ngoài ở chính giữa màn hình phình ra. Kiểu 
phẳng là loại đèn Trinitron chỉ cong theo chiều ngang và có chiều 
dọc phẳng. 

Các máy tính xách tay sử dụng bộ phận hiển thị là màn hình 
tinh thể lỏng { liquid crystal display ). Các LCD là các màn hình 
phẳng, công suất tiêu thụ điện rất thấp nhưng độ phân giải không 
cao và giá thành cao hơn so với màn hình dùng đèn CRT. 
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Có 3 loại thiết bị đầu cuối thường dùng : các thiết bị đầu cuối 
ánh xạ ký tự ( character-map terminal ), các thiết bị đầu cuối ánh 
xạ bit ( bit-map terminal ) hay màn hình đồ họa và các thiết bị đầu 
cuối chuẩn RS-232C ( reíerence Standard 232-C terminal ). Tất cả 
chúng đều dùng như một kiểu bàn phím nào dó, nhưng khác trong 
cách truyền thông với máy tính và cách điéu khiên xuát dữ liệu, ơ 
những phần sau chúng ta sè mô tá rõ từng loại thiẽt bị đầu cuối 
nay. 

Các thiết bị đầu cuôi ánh xạ ký tự 

Hầu hết các máy tính cá nhân đều sử dụng sơ đồ trình bày trong 
hình 2,23 đế hiến thị dữ liệu xuất lên màn hình. I Bàn phím được 
xứ lý như là một loại thiết bị hoàn toàn riêng ). Trên board truyền 
nối tiếp ( serial communieation board ) là một đoạn bộ nhớ ( chunk 
of memory ), gọi là RAM video ( video RAM ), cùng như một số mạch 
điện tứ dùng đế truy xuất bus và tạo tín hiệu video ( video signal ). 



Hình 2.23 Thiết bị dầu cuối xuất dữ liệu lòn màn hình 

CPU : đơn vị xứ lý trung tâm 

Main memory : bộ nhớ chính 

Character : ký tự 

Video boarđ : board video 

Attribute : thuộc tính 

Video RAM : bộ nhớ vicleo 

Analog video signal : Un hiệu video tương tự 

Monitor ; màn hình 

Bus : bus 
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Đế hiền thị các ký tự, CPU sao chép chúng vào bộ nhớ RAM 
video dưới dạng các byte xen kẽ ( alternate byte ). Mỗi ký tự dược 
kết hợp với một byte thuộc tính ( attribute byte ) dể mo tả cách thể 
hiện ký tự. Thuộc tính có thê bao gồm : màu sắc, cường độ, có nhấp 
nháy hay không v.v... . Do vậy, một màn hỉnh có 25 X 80 ký tự đòi 
hỏi 4000 byte trong RAM video, 2000 byte cho các ký tự và 2000 
byte cho thuộc tính của chúng. Một sô board có dung lượng bộ nhớ 
lớn hơn để lưu giữ nhiều ánh màn hình. 


Công việc cùa board video ( video board } là lặp lại việc tìm-nạp 
các ký tự từ RAM video và tạo ra các tín hiệu cần thiét điều khiến 
màn hình. Toàn bộ một dòng các ký tự được tìm-nạp một lần để có 
thể tính dược các dòng quét-riêng lé. Tín hiệu này là tin hiệu tương 
tự tần sô cao, diều khiến việc quét chùm tia điện tứ đế vè các ký tự 
lên màn hình. Vì boarđ video xuất tín hiệu video nên màn hình phải 
đặt gần máy tính { khoảng vài mét ). 


Các thiết bị đầu cuối ánh xạ bit 

Thay đối về ý tường ớ đáy là màn hình không được xem như 
dãy 25 X 80 các ký tự mà là một dăy các phần tứ hình ảnh, gọi là 
pỉxeỉ. Mỗi pixel có thể hoặc sáng hoặc tôì đế biểu thị 1 bit thông 
tin. Trên các máy tính cá nhân, màn hình có thê chứa khoảng 200 
X 320 pixel , nhưng thông thường là 480 X 640. Trẽn các trạm làm 
việc ( workstation ), màn hình tiêu biểu có 1024 X 1024 pỉxel. Các 
thiết bị đầu cuối thường dùng ánh xạ bit hơn là ánh xạ ký tự được 
gọi là các thiết bị đầu cuối ánh xạ bit hay màn hình đồ họa. Nhiều 
board video có thê hoạt động ớ cả 2 chế độ ánh xạ bit và ánh xạ 
ký tự dưới sự điều khiến cua phần mềm và ta gọi là board video đồ 
họa. 

Ý tướng như vậy cũng dùng sơ đồ như ớ hình 2.23, ngoại trừ 
RAM video được xem như một dãy bít lớn. Phần mềm có thể thiết 
lập một mẫu bất kỷ và mẫu đó được hiển thị tức thời. Đê vẽ các ký 
tư, phần mềm phái quyết định cấp phát, thí dụ, một ma trận có 
kích thước 9 x 14 bit và làm đầy những bit cần thiết đề làm cho ký 
tự xuất hiện. Phương pháp này cho phép chương trình tạo ra nhiều 
kiểu chữ ( font ) và trộn lẫn chúng nếu muôn. Toàn bộ phản cứng 
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chịu trách nhiệm hiên thị dãy bit. Màu sắc được quàn lý bằng cách 
dùng nhiều dãy, đôi khi gọi là các mặt pháng bit ( bit plane ). Với n 
mặt phẳng bit, có thế chọn một trong 2" màu cho mỗi pixel. Các 
thiết bị đầu cuối ánh xạ bit còn dùng đẽ hỗ trợ trong trường hợp 
hiển thị nhiều cửa số ( window ). Cửa số là một vùng của màn hình 
sử dụng cho một chương trình nào đó. Với nhiều cứa sổ ta có thể 
chạy nhiều chương trình cùng lúc, mỗi cửa số thể hiện kẽt quả của 
một chương trình độc lập với những chương trình khác. 

Mặc dù các thiết bị đầu cuối ánh xạ bit có tính mềm dẻo cao, 
nhưng chúng cũng có 2 bất lợi chính. Thứ nhát, chúng đòi hỏi một 
dung lượng RAM video đáng kể. Một màn hình 1024 X 1024 cần 
hơn 1 triệu bit, hoặc 128 Kbyte cho màn hình đơn sắc, và 1/2 
megabyte cho màn hình màu với 4 bit / pixel { trong khi các thiết bị 
dầu cuối ánh xạ ký tự chỉ là 128Kbyte cho cả màn hình màu lẫn đơn 
sắc ). 

Bất lợi thứ hai là vấn đề hiệu suất. Đề thê hiện bất cứ điều gì 
lên màn hình đều cần phái sao chép một lượng lớn dữ liệu. Thí dụ 
muốn chuyến một ký tự 9 X 14 lẽn màn hình ít nhất ta phải di 
chuyến 28 byte dừ liệu, cũng như một loạt công việc để chèn ký tự 
vào đúng vị trí. Tệ hơn nữa, việc cuộn màn hình thường có nghĩa là 
phải sao chép toàn bộ nhớ. Do đó, các thiết bị đầu cuối ánh xạ bit 
cần các CPU có tốc độ rất cao đè thao tác trẽn các bit hoặc phải 
được trang bị các phần cứng đặc biệt quán lý các pixel một cách 
nhanh chóng, từ đây hình thành ý tưởng chế tạo các chip đồ họa ( 
graphics chipset ). 

Hầu hết các màn hình hiện nay là các màn hình đa tần số ( 
multi írequency ) nhàm thích hợp với nhiều tiêu chuẩn khác nhau 
cùa tín hiệu video, chúng có các độ phân giải ( sô' pỉxel theo chiều 
ngang và chiều dọc ) khác nhau tùy theo loại màn hình : 

Loại màn hình kiểu mảng dồ họa video VGA ( video graphic 

array ) có độ phân giải 640 X 480. 

Loại màn hình kiểu siêu VGA SVGA ( super VGA ) có độ phân 

giải 800 X 600. 
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Loại màn hình kiểu mảng đồ họa mở rộng XGA ( extended 
graphics array ) có độ phân giải 1024 X 768. 

Loại màn hình kiêu UVGA ( ultra VGA ) có độ phán giải 1280 X 
1024. 

Đối với các màn hình màu người ta còn định nghĩa kích thước 
của một điểm ảnh (' dứng ra là khoảng cách giữa bộ ba điểm màu 
của một điểm ảnh tính bằng mm ). Kích thước này càng nhó ánh 
hiến thị càng nét, hiện nay khoáng 0,25 mm hay ít hơn. Hiện nay 
các máy tính cá nhản sứ dụng các màn hình dồ họa EGA, VGA, 
SVGA, XGA và ƯVGA. Thật ra các tên EGA, VGA, SVGA, XGA, 
ƯVGA là các tiêu chuấn công nghệ, chúng được hô trợ chạy trên các 
thiết bị cứa IBM và tương thích. 

Hệ điều hành Windows là phần mềm hỗ trợ cho các tiêu chuẩn 
này. Windows 3,1 không hoạt động trên các PC có độ phân giải dưới 
EGA ( enhanced graphics adaptor ) và Windows 95, Windows NT 
đòi hỏi tiêu chuẩn tối thiểu là VGA. Các board video dược chế tạo 
theo các tiêu chuẩn công nghệ kể trên. Hiệp hội tiêu chuấn điện tử - 
hình VESA dã đưa ra tiêu chuẩn VESA-SVGA cho các board video 
SVGA thống nhất cho các lập trình viên, gọi là VESA BIOS 
Extension. Bảng ở hình 2.24 tóm tắt một vài thông số điển hình của 
tiêu chuẩn này cho đồ họa SVGA. 

Trên các board video, RAM video thường có các dung lượng 256 
KB, 512 KB, 1 MB, 2 MB, 4 MB, 6 MB hoặc 8 MB, thường dùng 
nhất hiện nay là 1 MB và 2 MB. Dung lượng của RAM video lớn 
không làm tăng tốc độ của board video mà chỉ làm tăng khá năng 
lưu trữ nhiều hình ảnh với nhiều màu và độ phân giải cao. Thí dụ 
nếu cần 16 màu ( dùng 4 bit để biếu diễn màu ) cho mỗi pixeỉ và độ 
phân giải màn hình là 1024 X 768, dung lượng tối thiểu của RAM 
video đê hiển thị 1 ánh là : 

1024 X 768 X 4 = 3145728 bit = 393216 byte = 384 KB 

Như vậy ta phải chọn board video có RAM video tối thiểu 512 
KB. Bảng ở hình 2.25 tổng kết yêu cầu tối thiểu của RAM video ứng 
các độ phan giai va so mau khac nhau. 




cấu trúc May tính 


Ễ6S90 


Độ phán giãi 

Kích thước ky tụ 

Màu 

Tắn số quét 

640x480 

8x16 

16/256K 

31.5 KHz / 60 Hz 

37.6 Ki Iz / 75 Hz 

43.2 KHz / 85 Hz 

800x600 

8x8 

16/25CK 

37 9 KHz / 60 Hz 

46.9 KHz í 75 Hz 

53.7 KHz / 85 Hz 

1024x768 

8x16 

16/256K 

35.5 KHz / 87 Hz 

48.5 KHz / 60 Hz 

60.0 KHz / 75 Hz 

68.8 KHz / 85 Hz 

1280x1024 

8/16 

1G/256K 

35.5 KHz / 87 Hz 

35.5 KHz / 60 Hz 

640x480 

8x16 

16M/16M 

31.5 KHz /60 Hz 

800x600 

8x16 

16M/16M 

37.9 KHz / 60 Hz 


Hình 2.24 Các thông sò điên hình cua chuãn đồ họa SVGA 

Một vấn dề khác liên qua đến RAM video cùa các board video đồ 
họa là độ rộng cua bus dừ liệu giữa chip đồ họa và RAM video. Chip 
đồ họa thường là chip đơn nối trực tiếp với RAM video qua một bus 
cục bộ ( local bus ). số bít cho bưs dữ liệu cục bộ có thế là 64 bit 
hoặc thậm chí 128 bit ( không phải là bus dừ liệu 32-bit cũa khe bus 
mo' rộng trên board mẹ mà board video cám trên đó ). 

Đế cải tiến tốc độ của một board video, ta cần xem xét 3 khía 
cạnh : 

bộ xử lý đồ họa ( hay chip đồ họa ). 

RAM video 

Bus cục bộ 

» * 
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Độ phân giái 

Sò bít màu 

Sô màu 

RAM vìdeo 

640 X 480 

4 

16 

256 KB 

640 X 480 

8 

256 

512 KB 

640 X 480 

16 

04 K 

1 MB 

640 X 480 

24 

10 M 

1 MB 

800 X 600 

4 

16 

256 KB 

800 X 600 

8 

256 

512 KB 

800 X 600 

16 

64 K 

1 MB 

800 X 600 

24 

16 M 

2 MB 

1024 X 76S 

4 

16 

512 KB 

1024 X 768 

8 

256 

1 MB 

1024 X 768 

16 

64 K 

2 MB 

1024 X 768 

24 

16 M 

4 MB 

1280 X 1024 

4 

16 

1 MB 

1280 X 1024 

8 

256 

2 MB 

1280 X 1024 

16 

04 K 

4 MB 

1280 X 1024 

24 

16 M 

4 MB 


Hình 2.25 Các yêu cáu tỏi thiêu cùa RAM viđeo 

Trong những boarcl video nhiều năm trước đáy người ta sữ dụng 
công nghệ vùng đệm khung ( frame buffer technology ) trong đó 
board video chịu trách nhiệm hiển thị những khung riẻng biệt của 
hình ảnh còn việc tính toán đế tạo ra các khung này là trách nhiệm 
của CPU. Điều này làm cho CPU rất bận rộn và do vậy làm giảm 
thời gian dành cho các hoạt động khác. Công nghệ chip đồ họa được 
xem như đồng xử lý. Chip đồ họa thực hiện tất cả việc tính toán 
liên quan đến hình ảnh, CPU chi truyền những chỉ thị, thí dụ như 
tô màu một hình có kích thước và màu định trước. 
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Trước đây người ta sử dụng RAM dộng DRAM ( dynamic RAM ) 
làm RAM video nhưng loại RAM này ngày càng không thích hợp với 
các board video đồ họa có độ phân giái cao đòi hỏi tôc độ truyền dữ 
liệu phái rất cao. Thí dụ ở độ phân giải 1024 X 768, tần sô quét dọc 
72 Hz, số bit màu là 24 bit ( màu thực ) bộ nhớ RAM video phải 
được đọc ở tốc độ khoáng 170 triệu bit trong 1 sec, là tốc độ gần tôi 
đa cùa các DRAM qui ước. Hiện nay người ta dùng các loại RAM 
khác như EDO-RAM ( extended data out ), V-RAM ( video RAM ), 
MD-RAM ( multibank RAM ). SG-RAM { synchronous graphics RAM 
) làm RAM video. 

EDO-RAM là loại RAM nạp độc lập trước cho những mạch riêng 
biệt đề lần truy xuất kế tiếp sẽ bắt đầu trước khi lần truy xuất trước 
đó hoàn tất. EDO-RAM còn được sứ dụng trong bộ nhớ chính. 

V-RAM là loại bộ nhớ có cống kép cho phép bộ xử lý và chip gia 
tôc trên board video cũng như chip DAC hoặc ngay cả bộ vi xử lý 
cùa PC có thê truy xuất RAM video cùng một lúc. 

MD-RAM là kiểu bộ nhớ chuyên dùng cho những ứng dụng đồ 
họa và hình ánh. MD-RAM được tô chức thành những dãy nhỏ cho 
phép cài đặt ớ nhiều kích thước đa tích hợp 32 KB. Lấy thí dụ với 
độ phân giải 1024 X 768 và 24 bít inàu ta cần kích thước bộ nhớ 
RAM video là 2.3 MB. Nếu dùng các DRAM 256K X 16 và bus 64-bit 
kích thước bộ nhớ RAM video phải là 4 MB bao gồm 2 dãy mỗi dãy 
4 chip nhớ. Bằng cách dùng MD-RAM ta có thể cấu tạo bộ nhớ 2.5 
MB với 2 hoặc 3 chip rời. Như vậy tránh lâng phí được 1.5 MB, từ 
đó giảm giá thành cho bộ nhớ RAM video. 

SG-RAM là kiêu bộ nhó' có thế hoạt động được ở tần sò’ 66 MHz 
hoặc nhanh hơn cũng như dược sứ dụng trong các board mẹ có định 
chuẩn bus liên kết nôi thành phần ngoại vi PCI ( peripheral 
component interconnect ). 

Các hệ thống bus sứ dụng trong máy tính ( như ISA, EISA hoặc 
MCA ) ảnh hướng đến tốc độ xứ lý các thông tin hình ảnh. Chi tiết 
các loại bus này và các bus khác sẽ được đề cập đến trong chương 3. 
Bus ISA có 16 bit dữ liệu hoạt động ớ tần số 8.33 MHz. Các bus 
EISA và MCA có 32 bit dữ liệu nhưng chỉ hoạt động ở tần số 10 
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MHz. Các tần số" vừa nêu là các tô'c độ bus, không phải là tốc độ của 
CPU. Để cải thiện giới hạn này, người ta bố sung bus cục bộ;VESA ( 
VL-bus ) 32-bit hoạt động ở tốc độ đầy dủ của CPU lên đến 40 MHz. 
Khi hệ thống bus PCI được áp dụng, sô bit dừ liệu được xử lý đồng 
thời là 64 bit với tốc dộ 66 MHz. 

Cho đến hiện nay những người sữ dụng máy tính đả được nghe 
nhiều về các board video đa phương tiện ( multi-media ) có khả năng 
xử lý các ảnh tĩnh và ảnh dộng, xử lý tín hiệu hình, xử lý đồ họa 
v.v... . eũng như các board video xử lý ảnh động 3 chiều ( 3-D ). Trên 
các board video loại này người ta dùng chip chuyên dùng ASIC để 
nén và giải nén tín hiệu video theo giải thuật của MPEG. 

Thiết bị đầu cuối theo chuẩn RS-232-C 

Có hàng chục công ty chế tạo máy tính và hàng trăm công ty 
chế tạo các thiết bị đầu cuối. Để một thiết bị đầu cuối bất kỳ dùng 
được với bất kỳ máy tính nào, người ta chê ra một chuẩn giao tiêp 
cho phép kêt nôi giữa máy tính và thièt bị đầu cuôi ( Standard 
computer-terminal interface ), gọi là RS-232-C. Bất kỳ thiêt bị đầu 
cuối nào được hỗ trợ chuẩn giao tiêp RS-232-C đều có thề kêt nôi với 
một máy tính bất kỳ cũng được hỗ trợ chuẩn giao tiêp này. 

Các thiết bị đầu cuối theo chuẩn RS-232-C có một bộ kết nối 
chuẩn 25 chân ( 25-pin ). Chuẩn RS-232-C định nghĩa kích thước cơ 
khí và hình dạng bộ kết nối, các mức điện áp và ý nghĩa của từng 
tín hiệu trên mỗi chán. 

Khi máy tính và thiết bị dầu cuối ỡ cách xa nhau, phương pháp 
duy nhất thường thực hiện là kết nối qua mạng điện thoại. Đáng 
tiếc là mạng điện thoại không có khả năng truyền các tín hiệu như 
đã yêu cầu trong chuẩn RS-232-C, vì thế cần thêm vào một thiết bị 
gọi là modem giừa máy tính và điện thoại, giữa thiết bị đầu cuối và 
điện thoại để thực hiện trao dổi tín hiệu. Chúng ta sẽ nghiên cứu 
các modem trong phần kê tiêp. 

Hình 2.26 trình bày vị trí cứa máy tính, các modem và thiết bị 
đầu cuối khi sứ dụng đường dây điện thoại. Khi thiết bị đầu cuối và 
máy tính có khoảng cách đủ gần để có thể nối trực tiếp, ta không 
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cần sứ dụng modem, nhưng vẩn phái dùng cáp và bộ kết nôi RS- 
232-C giống nhau mặc dù không cần thiết sử dụng các chân liên 
quan đến điều khiến modem. 

Đẽ truyền thông, mỗi máy tính và thiết bị đầu cuôi đều có một 
chip gọi là thu phát không đồng bộ chung ƯART í universal 
asynchronous receiver transmitter ) cùng như mạch logic truy xuất 
bus. Đê hiển thị một ký tự, máy tính tìm nạp ký tự từ bộ nhó' chính 
và gới đến UART, sau dó ƯART dịch ký tự ra trên cáp RS-232-C 
từng bít một. Thực tế. ƯART là một bộ dối từ song song ra nói tiếp, 
vì toàn bộ một ký tự ( 1 byte I được đưa đến ƯART theo kiểu song 
song,ƯART xuất ra từng bit một ơ từng thời điểm với một tốc độ cho 
sẵn. Các tốc độ thường dùng sư dụng là 110, 300, 1200, 2400, 9600 
và 19200 bít / sec. 

Trong thiết bị dầu cuối, một ƯART khác thu nhận các bit và tái 
tạo lại toàn bộ ký tự sau đó hiến thị lên màn hình. Dữ liệu nhập từ 
bàn phím cùa thiết bị đầu cuôi đi qua một bộ chuyến dôi song song 
ra nối tiếp trong thiết bị đầu cuối, và sau đó được ƯART tập hợp lại 
trong máy tính. 

Hầu hết chuấn RS-232-C định nghĩa 25 đường tín hiệu nhưng 
trong thực tế chi có một sỏ' ít được sử dụng ( hầu hết bị bỏ qua khi 
thiẽt bị đầu cuối được nôi trực tiếp với máy tính không qua modem 
). Các chân 2 và 3 tương ứng với chân phát và nhận dữ liệu. Mỗi 
chân điều khiến một luồng bít theo một hướng ( one-vvay ) ngược 
nhau. 

Khi bật nguồn thiết bị đầu cuối hoặc máy tính, tín hiệu DTR, dữ 
liệu thiết bị dầu cuối sần sàng ( data terminal ready ), được lập lên 
1 để báo cho modem biết rằng đang hoạt động. Tương tự, modem lập 
đường tín hiệu DSR, dừ liệu được đặt sẵn sàng { data set ready ), lên 

1 đề báo sự hiện diện. 

* * * 

Khi muốn phát dữ liệu, thiết bị đầu cuối hoặc máy tính đưa 
đường tín hiệu yêu cầu phát RTS ( request to send ) lên 1 để yêu cầu 
cho phép. Nếu modem muốn cấp phép, modem sẽ đưa tín hiệu xóa 
dể phát CTS { clear to send ), lèn 1 để trả lời. 
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Serlal 1/0 card 



Some slonals : 


Protective ground (1) 

-► Transmít (2) 

-Receive (3) 

-► Request to send (4) 

-*-Clear to send (5) 

^-Data set ready (6) 

Common return (7) 

-Carrler detect (8) 

-► Data terminal ready (20) 


Hình 2,26 Kết nôi giừa thiết bị đầu cuối theo chuân RS-232-C với máy 

tính. 

CPU : bộ xứ lý trung tãm 
Memory : bộ nhớ 

Serial 1/0 card : card xuất / nhập nối tiếp 
RS 232-C connector : bộ nối theo chuẩn RS 232-C 
Telephone line ( analog ) : đường dây điện thoại ( tương tự ) 

Terminal : thiết bị đầu cuối 
Keyboarcỉ : bàn phím 
Some signals : các tín hiệu 
Protective ground : đất 
Transmit : phát 
Receive : thu 

Request to send : yèu cầu phát 

Clear to send : xóa đê phãt 

Data set ready : dử liệu dược đạt san sàng 

Common return : chán chung quay vẽ 

Carrier detect : phát hiện sóng mang 

Data terminal ready : dữ liệu thiết bị đầu cuối sần sàng 

( Số được ghi trong các dấu ngoặc trong danh sách tín hiệu là số chán ). 
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Các chân cũa đầu nôi công nối tiếp 9 chân 


Chân 

Tín hiệu 

Mỏ ta 

I/O 

1 

CD 

Phát hiện sóng mang 

Nhập 

2 

RxD 

Nhận dử liệu 

Nhập 

3 

TxD 

Phát dừ liệu 

Xuất 

4 

DTR 

Dử liệu dau cuối sản sàng 

Xuất 

5 

SG 

Nối dất 

— 

6 

DSR 

Dử liệu dược dặt sần sàng 

Nhập 

7 

RTS 

Yêu cầu phát 

Xuất 

8 

CTS 

Xóa đê phát 

Nhập 

9 

RI 

Tín hiệu chỉ báo rung chuông 

Nhập 


Kết nối đối 9 chân thành 25 chân 


9 chân 

25 chân 

Tín hiệu 

1 

1 

8 

CD 

2 

3 

RxD 

3 

2 

TxD 

4 

20 

DTR 

5 

7 

SG 

6 

6 

DSR 

7 

4 

RTS 

8 

5 

CTS 

9 

22 

RI 


Hình 2.27 Các chân ra cùa đầu nối 9 chán và kết nối (lổi 9 chân thành 25 

chân 
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Các chân còn lại được dùng cho những trạng thái khác nhau, đẽ 
kiểm tra và các chức nảng về định thì. 

Các báng trong hình 2.27 chỉ rõ những chân ra của những đáu 
nối nối tiếp 9 chân và kết nối đổi 9 chân thành 25 chân. 

Chip 8250 UART sử dụng trong các máy IBM PC chuẩn ban đầu 
và hiện vần còn sử dụng trong các board nối tiếp giá thành thấp. 
Các PC AT 286 sử dụng chip 16450 UART , chip này thích hợp hơn 
đối với các đường truyền tốc độ cao so với chip 8250. Tuy nhiên cả 2 
đều giống nhau đối với hầu hết các phần mềm, Chip 16550A UART 
sử dụng trước tiên trong các hệ thống PS/2, chip này có các chức 
năng giống và có chân tương thích với chip 16450, chỉ khác là có 
thêm vùng đệm thu phát 16 byte trợ giúp cho những truyền thông 
nhanh hơn và cho phép nhiều kênh DMA truy xuất. Hiện nay chip 
này sử dụng rộng rãi trong các IBM PC hoặc trong các hệ thống 
tương thích. 

Chip UART là thành phần chủ yếu của cổng nôi tiếp COM trong 
các IBM PC hiện nay. Khi một cổng nôi tiếp được cài đặt trong hệ 
thông, ta phải cấu hình'cổng để sử dụng các địa chí I/O riêng biệt ( 
địa chỉ cổng ) và các yêu cầu ngắt IRQ ( interrupt request X chi tiết 
về ngắt được trình bày trong các chương sau ). Sau đây là những địa 
chỉ cổng và các ngắt chuẩn ( hình 2.28 ) 


Hệ thông bus 

COMx 

Địa chỉ cổng 

IRQ 

Tất cả 

COM1 

3F8H 

IRQ4 

Tất cả 

COM2 

2F8H 

IRQ3 

Bus ISA 

COM3 

3E8H 

IRQ4* 

Bus ISA 

COM4 

2E8H 

IRQ3* 


Hình 2.28 Các địa chỉ cổng và ngắt chuấn 
( * : thực tế nên chọn các ngắt khác ). 

Bus ISA ( industry Standard architecture ) ban đầu là bus 8-bit 
của IBM PC cho các máy PC chuẩn và XT, sau đó mở rộng thành 
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16 bit cho IBM PC AT. ISA là cơ sở cho máy tính cá nhân hiện đại 
và là kiên trúc ban đầu được sứ dụng trong dại da sỏ các hệ thông 
PC. Chi tiêt về các loại bus sẽ đề cập trong chương 3. Hệ thông bus 
ISA 8-bit có 8 mức ngắt trong khi hệ thống bus ISA 16-bit có 1G 
mức ngát. 

Hiện nay Windows 95 hò trợ tới 128 cống nối tiếp, cho phép ta 
sư dụng nhừng board nhiều cống nói tiếp trong hệ thống. Các board 
này cho phép hệ thống thu thập và sứ dụng dử liệu chung với nhiều 
thiết bị với chi một khe mớ rộng và một ngắt. 

2.3.2 Modem 

Với lượng máy tính sứ dụng tăng ngày càng nhiều, nhu cầu 
truyền thông tin giữa máy tính này với một máy tính khác ngày 
càng tàng. Thí dụ, nhiều người sứ dụng máy tính cá nhản ỡ nhà 
muốn thòng tin với máy tính cua họ ờ nơi làm việc, với các hệ thống 
công việc ngân hàng tại nhà hoặc với các báng thông báo điện tử. 
Tất cá những ứng dụng này đều dùng hệ thống điện thoại đề cung 
cấp đường thông tin. 

Tuv nhiên, đường dây điện thoại tự nhiên, không thích hợp đế 
truyền tín hiệu máy tính, trong dó tín hiệu được biếu thị 1 với điện 
áp khoáng 5 volt và 0 với điện áp 0 volt, như trình bày trong hình 
2.29(a). Tín hiệu hai mức điện áp sẽ bị sái dạng khi truyền qua 
đường dây điện thoại dẫn đến các lỗi truyền. Một tín hiệu sóng sin 
ớ tần sô khoảng từ 1000 tới 2000 Hz, gọi là sóng mang ( carrier ), 
khi truyền đi sẽ ít bị sái dạng hơn. Điều này được khai thác làm cơ 
sớ cho hầu hết các hệ thõng thòng tin. 

Do sự thay đối cúa sóng sin hoàn toàn có thế đoán trước, nên 
một sóng sin thuần túy khi truyền đi sè không mang theo một 
thòng tin nào cá. Tuy nhiên, bằng cách thay đổi biên độ, tần số 
hoặc pha, chuỗi các bit 1 và ũ được phát đi như trong hình 2.29. Quá 
trình này gọi là sự điều chế ( modulation ). 

Trong diều chế biên độ ( amplitude modulation ) [ xem hình 
2.29(b) j, 2 mức điện áp khác nhau tương ứng với 0 và 1 được sử 
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dụng. Dữ liệu số phát ở tốc độ rất thâ'p sẽ nghe một tiếng ồn lớn đối 
với bit 1 và không có ồn đối với bit 0. 


(b) 


(c) 


<d) 
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Hình 2.29 Truyền số nhí phân 01001011000100 trên đường (láy điện thoại 
từng bit một (a) Tín hiệu 2 mức điện áp (b) Điều chế biên độ (c) Điéu 

ché tần sô (đ) Điều chê pha 

Time : thời gian 
Voltage : điện áp 
High amplituđe : biên độ cao 
Low amplituđe : biên độ tháp 
High írequency : tán sô cao 
Low írequency : tần sô thảp 
Phase change : sự thay đôi pha 

Trong điều chế tần số [ xem hình 2.29(c) ], mức điện áp là hằng 
sô nhưng tần sô sóng mang sè khác nhau dôi VƠI 1 va 0, dư liẹu so 
được diều chế tần số sẽ nghe 2 âm ( tone ) tương ứng với 0 và 1. 
Cách điều chế tần số như vậy còn được gọi là lập khóa dịch tần sô 
FSK ( trequency shift keying ). 

Trong điểu chế pha ( phase moduiation ) đơn giản [ xem hình 
2.29(d) I, biên độ và tần số không thay đổi, nhưng pha của sóng 
mang thay đổi 180° khi dừ liệu chuyển từ 0 sang 1 hoặc từ 1 sang 0. 
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Trong các hệ thông điều pha phức tạp hơn, lúc bắt đầu của mỗi 
khoảng thời gian ( time interval ) , pha sóng mang bị dịch đi 45, 
135, 225, hoặc 315 độ cho phép với mỗi khoảng thời gian tương ứng 
ta sẽ có 2 bit, gọi là mã hóa pha 2 bit ( dibit ). Với những sơ đồ 
khác người ta cũng có thể truyền 3 hoặc nhiều bit ở mỗi khoảng 
thời gian. Số các khoảng thời gian trong một sec gọi là tôc độ baud. 
Với mỗi khoảng thời gian có 2 hoặc nhiều bit, tôt độ bit ( bit rate ) 
sẽ lớn hơn tốc độ baud { baud rate ). Nhiều người thường nhầm lẫn 
2 thuật ngữ này. Cách điều chế pha như vậy còn được gọi là lập 
khóa dịch pha PSK ( phase shift keying ). 

Ngoài các kỷ thuật điều chế sóng mang nêu trên, người ta còn 
kết hợp các thay đổi pha với các thay đồi biên độ trong sóng mang 
bị điều chê và gọi là điều chê QAM ( quadrature amplitude 
modulation ) nhằm chuyên tải nhiều thông tin hơn. 

Nếu dữ liệu phát là một chuồi các ký tự 8-bit, người ta muốn 
đường truyền có khả năng kết nôi 8 bit đồng thời, nghĩa là 8 đôi 
dây. Vi đường dây điện thoại chỉ cung cấp 1 kênh ( channel ), nên 
các bit phải được phát nôi tiếp, bit này sau bit kia ( hoặc nhóm 
thành 2 nếu dùng phương pháp mã hóa dibit ). Loại thiết bị nhận 
các ký tự từ một máy tính dưới dạng các tín hiệu 2 mức, 1 bit ở một 
thời điểm và phát các bit ở dạng các nhóm 1 hoặc 2 bít được điều 
biên, điều tần hoặc điều pha gọi là modem. 

Modem phát các bit riêng lẻ trong 1 'ký tự ở những khoảng thời 
gian cách đều nhau. Thí dụ, với tốc độ dữ liệu 1200 baud, tín hiệu có 
sự thay đổi cứ sau mỗi 833 microsec. Dùng một modem thứ 2 ở đầu 
thu để đổi sóng mang đã điều chế thành sô' nhị phân. Bởi vì các bit 
đến đầu thu ở nhừng khoáng thời gian cách đều nhau, nên ngay khi 
modem thu xác định điểm bắt đầu của một ký tự, đồng hồ ( clock ) 
của modem cho biết khi nào phải lấy mầu tín hiệu đường truyền để 
đọc giá trị của các bit riêng lẻ. 

Bell Lab và ủy ban tư vấn quốc tế về điện thoại và điện tín 
CCITT ( consultative, committee on International telephone and 
telegraph ) đã đặt ra những tiêu chuẩn cho các nghi thức ( protocol ) 
truyền qua modem. Tố chức này được đặt tên là Hiệp hội viễn 
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thông quốc tế ITU ( International telecommunication Union ) và các 
nghi thức được phát triển gọi là các tiêu chuẩn ITU-T. 

Các modem thường tuân theo các tiêu chuẩn khác nhau tùy vào 
nhừng đặc trưng và khả năng của chúng. 

Dựa vào kỷ thuật điều chế, ta có các tiêu chuẩn Bell 103 ( 300 
bps FSK ), Bell 212A ( 1200 bps DPSK [ differential PSK ], DPSK là 
dạng điều chế lập khóa dịch pha vi phân ), V.21 ( 300 bps FSK ), 
V.22 ( 1200 bps DPSK ), v.22bis ( 2400 bps QAM nghĩa là 600 baud 
do truyền 4 bit trong mỗi baud ), V.23 ( 1200 bps theo 1 chiều và 75 
bps cho chiều ngược lại gọi là modem song công đầu đù giá [ pseudo- 
íulhduplex J, V.29 ( 9600 bps bán song công ), V.32 ( 9600 bps song 
công sử dụng điều chê QAM mã hóa lưới TCQAM [ trellis coded 
QAM ] ), v.32bis ( giống V.32, 14400 bps TCQAM nhưng có tốc độ 
baud là 2400 baud do truyền 6 bit cho mỗi baud ), V.34 ( 28.8 Kbps, 
31.2 Kbps và 33.6 Kbps sử dụng bộ xử lý tín hiệu kỹ thuật sô hỗ trợ 
cho tốc độ cao ). 

Phát hiện lỗi là khả năng của một sô modem nhận biêt có lồi 
phát sinh và yêu cầu truyền lại dữ liệu đã bị sai. Hai modem ở 2 
thiết bị truyền và nhận phải có cùng tiêu chuẩn phát hiện lỗi và sửa 
lồi. Các nghi thức sửa lỗi đã được dùng là nghi thức mạng của 
Microcom cho các tiêu chuẩn MNP1 đến MNP4 ( Microcom 
netvvorking protocol ), thủ tục truy xuât liên kêt cho các modem 
LAPM ( link access procedure for modems ) cho tiêu chuẩn V.42 v.v... 


Nén dữ liệu là khả năng cài đặt sẵn trong một số modem nhằm 
tiết kiệm thời gian truyền và chi phí truyền. Hiệu suất nén càng cao 
tốc dô truyền dữ liêu cua modem càng lớn. Thi dụ như hiẹu suat nen 
là 4 : 1 sẽ tăng tốc độ của modem lên 4 lần, modem 14400 bps có dữ 
liệu được nén sẽ có tốc độ truyền 57600 bps và modem 28.8 Kbps có 
thể đạt đến 115200 bps. Tiêu chuẩn MNP5, v.42bis là các tiêu 
chuẩn có nghi thức nén dữ liệu. 

Các modem mới nhất hiện đang được sử dụng rộng rái có tốc độ 
truyền dữ liệu là 56 Kbps, 
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Truyền đổng bộ và bât đồng bộ 

Co 2 phương pháp khác nhau được dùng dẻ truyền các ký tự. 
Trong phương pháp truyền bất đổng bộ ( asynchronous ), khoáng 
thời gian giữa 2 ký tự không cô định, mặc dù khoảng thời gian giữa 
2 bit liên tiẽp trong một ký tự có định. Thí dụ, một người đánh máy 
trên một thiết bị đầu cuối chia xé thời gian ( time-sharing terminal 
) sẽ không đánh ớ cùng một tóc độ, như vậy khoáng thời gian giữa 2 
ký tự liên tiếp không phái là hàng số. 

Sự biến thiên tỏc độ này lẩm nãy sinh vấn đề làm thế nào máy 
thu có thê nhận ra bit đầu tiên cúa một ký tự. Nếu sứ dụng các 
phương pháp điều chế trong hình 2.29, ta không có cách nào phân 
biệt giữa bit 0 và không có dừ liệu. Một ký tự gổm toàn các bit 0 sẽ 
không thê nào nhìn thấy dược. Hơn nửa, một ký tự gồm toàn bit 1 
theo sau là 7 bit 0 sẽ không phân biệt được với một ký tự gồm 7 bit 
0 và theo sau là bit 1. bơi vì máy thu không có cách nào biết được có 
bit 1 hay không ớ dáu, o' giừa, hoặc ờ cuối ký tự. 

Đè giúp máy thu nhận ra nơi bắt đầu một ký tự, người ta phát 
trực tiếp một bit start ngay trước mỗi ký tự. Đê cải tiến độ tin cậy, 
người ta phát thém 1 hoặc 2 bit stop ngay sau mỗi ký tự. Thòng 
thường, đường truyền dược giữ ớ trạng thái 1 khi không có dữ liệu 
dược phát dê cho phép phát hiện mạch hờ, vi vậy bit start là 0. Các 
bít stop là 1 đế phân biệt với các bit start. Giữa bit start và các bit 
stop là các bit dữ liệu dược phát ớ những khoảng thời gian bằng 
nhau. Bộ định thì trong modem thu được khởi động khi bit start 
đến, cho phép modem nhận biết bit bắt đầu của ký tự. Phương pháp 
truyền bất đồng bộ được minh họa trong hình 2.30(a). 

Trong phương pháp truyền bất đồng bộ, tốc độ bit { bit rate ) 
trong khoảng từ 110 bps tới 19200 bps. ớ tốc độ 110 bps, người ta 
dùng 2 bit stop. vì thế một ký tự 7-bit, cộng với 1 bit kiểm tra chẵn 
lẻ, 1 bit start, 2 bit stop sẽ cho một khung 11-bit. Do vậy, HObps 
tương ứng với tốc dộ 10 ký tự mỗi giây. Ở những tốc độ cao hơn, 
người ta chi dùng 1 bit stop. 

Phương pháp truyền đồng bộ í synchronous ) không sứ dụng 
bit start và các bit stop. Kết quá lã tốc độ truyền dừ liệu được tàng 
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lẻn. Truyền đồng bộ thường tiến hành ở tốc độ 4800 bps, 9600 bps, 
hoặc thậm chi còn cao hơn. Trong phương pháp này, một khi đà 
đông bộ, các modem vần tiêp tục gởi các ký tự đẽ duy trì đồng bộ, 
ngay cá lúc không phát dừ liệu. Một ký tự đặc biệt “idle” được gởi đi 
khi không có dữ liệu phát. Trong phương pháp truyền đồng bộ, 
không giống như truyền bất đồng bộ, khoáng thời gian giừa 2 ký tự 
luôn bàng nhau. 


Time between characters is variable 



(a) 



Time between characters ỉs constant 


(b) 


Hình 2.30 Các phương thức truyền (aí Truyền bất dỏng bộ (bi Truyền 

đồng bộ. 

Time betvveen characters is variable : thời gian giữa các ký tự thay đổi 
Time : thời gian 

Time betvveen characters is constant : thời gian giừa các ký tự là hằng sỏ 

Truyền đồng bộ đòi hỏi các xung clock trong máy thu và phát 
phải duy trì đồng bộ trong những khoảng thời gian dài, trái lại điều 
này không cần đến trong truyền bất đồng bộ do có sự bắt đầu cùa 
mỗi ký tự đã được chi rỏ bằng 1 bit start. Thời gian truyền có thế 
tiếp tục láu mà không có sự tái đồng bộ cùa máy thu với pha cùa 
máy phát tùy thuộc vào sự ổn định của các xung clock. Điển hình 
các xung clock phải ổn định đủ đẽ cho phép các khối hàng ngàn ký 
tự phát đi mà không cần sự tái dồng bộ. 
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Đôi khi những khôi ký tự này dùng mã Hamming hoặc những kỹ 
thuật khác đế phát hiện và sửa lỗi đường truyền. Phương pháp 
truyền đồng bộ được trình bày trong hình 2.30(b). 

Truyền đơn công, bán song công và song công 

Có 3 phương pháp truyền được dùng trong mục đích truyền 
thông tin : đơn công, bán song công, và song công. Đường truyền 
đơn công ( simplex ) có khả năng truyền dữ liệu chỉ theo một hướng. 
Nguyên nhân không phải do tính chất của đường dây, đơn giản chỉ 
vì một đầu cuối chỉ có 1 máy phát và đầu cuối kia chỉ có một máy 
thu. Cấu hình này ít được dùng trong các máy tính vì không có cách 
nào đẽ máy thu phát tín hiệu nhận biết ( acknovv-ledgement signal ) 
tới máy phát, cho biết thông điệp ( message ) đã được nhận đúng. 
Phát thanh và truyền hình là những thí dụ về truyền đơn công. 

Đường truyền bán song công ( half*duplex ) có thể phát và nhận 
dữ liệu trên cả 2 hướng nhưng không đồng thời. Trong suôt một cuộc 
truyền, một modem sẽ là máy phát và modem còn lại là máy thu. 
Tình hupng thông thường là thiết bị Ay hoạt động như một máy 
phát, gơi một chuỗi các ký tự tới thiết bị B, hoạt động như một máy 
thu. Sau đó A và B đổi vai trò cho nhau, B gởi thông báo trở lại A 
cho biết ký tự nhận được có lỗi hay không. 

Nếu không có lỗi đường truyền, A và B đổi vai trò lần nữa, và 
A sẽ gởi thông điệp kế tiếp tới B. Nếu có lỗi, A phát lại thông điệp 
đã gời lần nữa. Sự đối thoại ( conversation ) giữa máy phát và máy 
thu về điều gì phải làm kế tiếp gọi là nghi thức truyền ( protocol ). 
Thời gian cần để chuyển đường truyền bán song công từ hướng này 
thành hướng kia có thể dài gấp nhiều lần thời gian truyền ký tự. 
Đường xe lửa là một ví dụ của phương thức truyền bán song công, 
bởi vì nó có thể điều hành giao thông trên cả 2 hướng nhưng không 
đồng thời. 

Ngược lại, đường truyền song công ( full-duplex ) có thể phát và 
nhận dữ liệu đồng thời ở cả 2 hướng. Một cách khái quát, đường 
truyền song công tương đương với 2 đường truyền đơn công, một 
đường cho mỗi hướng. Vì 2 đường truyền có thể tiến hành song 
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song, một đường cho mỗi hướng, nên truyền song công có thề phát 
nhiều thông tin hơn truyền bán song công với cùng tốc độ dữ liệu, 
truyền song còng không mất thời gian để thay đối hướng truyền. 

2.3.3 Chuột 

Càng ngày người sứ dụng máy tính càng không cần có nhiều 
kiến thức về cách làm việc của máy tính. Các máy tính thế hệ 
ENIAC chì dược người chê tạo ra nó sử dụng. Vào những năm 1950, 
các máy tính chi được sừ dụng bới những chuyên gia lập trình lành 
nghề. Ngày nay, con người có thể sứ dụng máy tính một cách rộng 
rãi vào một số công việc mà họ muôn thực hiện, và họ không cần 
biết nhiều ( hoặc thậm chí không muôn biết ) về cách làm việc của 
máy tính hoặc cách lập trình trên máy tính. 

Nhiều người nhận thấy việc gõ các chỉ thị ( thường khó hiểu ) 
trên bàn phím là khống quen thuộc với người sứ dụng. Người ta rât 
thích những hệ thông trong đó máy tính thề hiện các thực đơn trên 
màn hình, và họ trò tới mục mà họ muôn. Dùng mô hình này đòi 
hỏi phải có một cách để tró trên màn hình. Chuột ( mouse ) là thiêt 
bị thông dụng nhất cho phép người sử dụng tró trên màn hình.. 

Chuột được Douglas Englebart phát minh vào năm 1964 tại 
trường đại học Staníord. Chuột chính thức được gọi là bộ định vị X- 
Y trên màn hình. Năm 1973, Xeror áp dụng chuột cho hệ thông máy 
tính AI to cải tiến, vào lúc này đang dược thí nghiệm và chỉ sử dụng 
cho nghiên cứu. 

Chuột là một hộp plastic nhỏ dặt trên bàn cạnh thiết bị đầu 
cuối. Khi di chuyển chuột trên bàn, một con trỏ nhỏ trên màn hình 
cũng di chuyển theo, cho phép người sử dụng trò tới các mục trên 
màn hình. Chuột thường có 2 hoặc 3 nút nhấn ( button ), cho phép 
chọn các mục từ thực đơn ( menu ) trên màn hình. Đã có nhiều 
tranh luận về vấn dề chuột cần phải có bao nhiêu nút nhấn. Người 
bình thường thích có một nút nhấn hơn ( vì khó có sự lầm lẫn ), 
những người thành thạo thích có nhiều nút để thực hiện những điều 

khác thường. 
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Có 3 loại chuột đang được sử dụng : chuột cơ khí ( mechanical 
mouse ), chuột quang ( optical mouse ) f và chuột cơ khí-quang ( opto- 
mechanical mouse ). 

Một loại chuột cơ khí có 2 bánh xe cao su nhó ra ở phía dưới, có 
các trục vuông góc nhau được minh họa trong hình 2.31. Khi chuột 
di chuyến song song với trục chính, một bánh xe sẽ quay. Khi di 
chuyên thắng góc với trục chính, bánh xe kia sẽ quay. Mỗi bánh xe 
sẽ điều khién một biến trớ. Bằng cách đo sự thay đổi điện trở, có 
thế biết mỗi bánh xe quay bao nhiêu, và như vậy tính được chuột đă 
di chuyền bao xa theo mỗi hướng. 

Pointer controlled by mouse 



Hình 2.31 Chuột có bánh xe dùng đề trò đến các mục trong menu 
Window : cứa sổ 

Pointer controlleđ by mouse : con trỏ điều khiến bơi chuột 
Menu : thực đơn 

Mouse buttons : các nút nhấn cùa chuột 
Mouse : chuột 

Rubber vvheels : các bánh xe cao su 

Direction of wheel motion : hướng chuyển động cũa bánh xe 

Một loại chuột cơ khí khác cùng đạt được hiệu quả như vậy bằng 
cách dùng một quá cầu nhò hơi nhô ra ở phía dưới. 

Loại thứ 2 là chuột quang. Loại này không có bánh xe hoặc quả 
cầu, thay vào đó một diod phát sáng LED ( light emitting diode ) và 
một bộ tách quang phía dưới. Chuột quang được dùng trên một 
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miếng dệm plastic đặc biệt có một mạng lưới các dòng ke chữ nhật 
cách khoáng gần nhau. Khi chuột di chuyến trên lưới, bộ tách quang 
dò dòng kè đi ngang qua bàng cách xem sự thay đối lượng ánh sáng 
phản hồi từ LED. Mạch điện tứ bên trong chuột sẽ đèm sò dòng cùa 
mạng lưới đi qua theo mỗi hướng. 

Loại thứ 3 là chuột cơ khí-quang. Giỏng như chuột cơ khí có 2 
bánh xe, chuột cơ khí-quang cũng có 2 bánh xe quay được gắn 
vuông góc nhau, Tuy nhiên, mỗi bánh có một LED Ư giữa và một 
loạt khe hờ cách đều nhau xung quanh chu vi bánh xe cùng với một 
bộ tách quang đặt ngay bèn ngoài bánh xe. Khi chuột di chuyền, các 
bánh xe quay và các xung ánh sáng dập vào bộ tách quang mỗi khi 
có một khe hơ xuàt hiện giữa LED và bộ tách quang, sỏ xung 
phát hiện được sẽ ti lệ với khoáng cách di chuyên trên mán hình 
của con trỏ. 

Mặc dừ chuột được thiết kế theo nhiều cách khác nhau, nhưng 
thông thường khi sứ dụng, chuột dều gỡi một chuỗi 3 byte tới máy 
tính sau mỗi 100 nisec. Các ký tự tới máy tính thường di trẽn đường 
cáp RS-232-C, như thể chúng dược đánh trên bàn phím. Byte đầu 
tiên chứa một sỏ nguyên có dáu cho biẽt chuột đã di chuyên theo 
trục X bao nhiêu đơn vị trong 100 msec cuối. Byte thứ 2 cũng cho 
biết thông tin như vậy nhưng theo trục Y. Byte thứ 3 chứa trạng 
thái hiện tại cùa các nút nhân. Đòi khi người ta còn dùng 2 byte cho 
mỗi trục tọa độ. 

Phần mềm câp tháp trong máy tính nhạn thong tin nay \a doi 
chuyến động tương đỏi do chuột go '1 tơỉ thanh VỊ tri tuyẹt đoi. Sau đo 
một mùi tên ( con trỏ ) được hiến thị trẽn màn hình ó' vị trí tương 
ứng với vi trí cùa chuột. Khi mũi tên tro tơi mọt mục thích hợp, 
người sứ dụng nhấp ( click ì một nút nhấn, lúc đó máy tính sè hiếu 
mục nào đã được chọn từ sự nhặn biết mũi tên dang ứ nơi nào 

trên màn hình. 

Cuối năm 1996, Microsoft đưa ra một loại chuột mới gọi là 
chuột thòng minh { intellimouse ), tuy giống như các chuột 
Microsoít chuẩn nhưng có thêm một bánh xe nhỏ ở bén trên giừa 2 
nút phải và trái cùa chuột. Bánh xe này có 2 chức năng, chức nàng 



11108 


Cấu trúc Máy tính 


chủ yếu là cuộn các tài liệu hoặc những trang Web bằng cách đẩy 
bánh xe tới lui, chức nâng thứ hai giông như nút nhân thứ ba của 
một chuột có 3 nút nhấn. Loại chuột này rất thuận tiện khi ta duyệt 
nhiều trang Web, làm việc với các bảng tính, v.v... . 

Để sử dụng chuột thông minh ta phải có phần mềm hỗ trợ như 
Microsott Internet Explorer. Những ứng dụng trong Office 97 cũng 
hổ trợ chuột thông minh, phần mềm này còn cho phép ta ấn giữ 
phím Ctrl khi xoay bánh xe để phóng to, thu nhỏ. 

Hiện nay, chuột có thế ghép nối với các PC bằng các giao tiếp : 

. giao tiếp nối tiếp 

. giao tiếp chuột PS/2 

. giao tiếp bus. 

Với giao tiếp nối tiếp, chuột nối với các PC qua các cổng nối tiếp 
COM ( thường có 2 cổng nối tiếp cho 1 PC là COM1 và COM2 ). 
Đầu nối trên cáp của chuột là đầu nối đực 9 chân hoặc 25 chân. 

Phần lớn những máy tính mới hiện nay có cổng chuột chuyên 
dụng trên board mẹ, giao tiếp này gọi là giao tiếp chuột PS/2 vì được 
sử dụng trên các hệ thống PS/2 cùa IBM từ năm 1987. 

Chuột sứ dụng giao tiếp bus thường được dùng trong các hệ 
thống không có cổng chuột chuyên dụng trên board mẹ hoặc không 
có các cổng nôi tiếp. Board giao tiếp bus riêng cắm trên khe mở 
rộng của board mẹ và truyền thông với trình điều khiển thiết bị 
bằng bus của board mẹ. 

2.3.4 Máy in 

Thiết bị đầu cuối CRT có thể đáp ứng được với nhiều ứng dụng, 
nhưng đối với những ứng dụng khác như cần in hồ sơ ra giấy phải 
cần đến một loại thiết bị khác. Để thỏa mãn được nhu cầu này 
người ta đả chế tạo ra nhiều loại máy in. Dưới đây chúng ta sẽ mô 
tả vắn tắt các loại máy in chính và cách làm việc của chúng. 
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Máy in tác động 

Máy in loại cồ xưa nhât, máy in tác động ( impact ), iàm việc 
giông như một máy đánh chừ : một miêng kim loại hoặc plastic có 
chữ nổi đập vào một dải ruy băng mực tiếp xúc với tờ giấy, đẽ lại 
một chữ trên giấy, như trình bày trong hình 2.32(a). Trên các máy 
tính cá nhân hiện nay, dạng in này được dùng trong các máy in có 
bánh xe loại vòng ( daisy wheel ), chúng có một bánh xe hình nan 
hoa ( giống như hình một hoa cúc đại ) với các ký tự trên các cánh, 
được minh họa trên hình 2.32(b). Đê in một ký tự, máy in quay ký 
tự đúng dến trước một nam châm điện, sau đó cho điện chạy qua 
nam châm, ấn ký tự đó dập vào ruy băng. Máy in loại này có chất 
lượng tốt, đặc biệt khi dùng với dái ruy băng than (jíarbon ), đạt tốc 
độ từ 20 tới 40 ký tự mỗi giây. 

Các mainírame lớn cũng dùng máy in tác động, nhưng ở đây các 
ký tự được tạo nổi trên một xích bằng thép bao bọc tờ giây. Máy in 
80 cột sẽ có 80 cái búa, mồi búa cho một vị trí cột. Một dòng được in 
bằng cách hướng dẫn búa đập vào ngay chữ thích hợp phía trước nó. 
Trong một vòng quay của xích, từng ký tự sẽ xuất hiện ớ mỗi cột, vì 
vậy có thế’ in toàn bộ một dòng. Những máy in này có thể in 1 
trang chỉ trong vài giây hoặc ít hơn. 

Máy ỉn ma trận 

Loại máy in thông dụng khác là máy in ma trận ( matrix printer 
), trong dó đầu in có từ 7 đến 24 kim hoật hóa từ tính được quét 
ngang qua mỗi dòng in. Máy in loại rẻ tiền có 7 kim đề in 80 ký tự 
trên một dòng với mỗi ký tự là một ma trận là 5 X 7. Thực tế, dòng 
in lúc đó gồm 7 dòng ngang, mỗi dòng có 5 X 80 điểm. Mỗi điểm 
có thể được in hoặc không in tùy thuộc vào ký tự được in. Hình 
2.33(a) minh họa chữ “A” dược in trên một ma trận 5x7. 

Người ta có thể tàng chất lượng in lên bằng 2 kỷ thuật : dùng 
nhiều kim hơn và có các vòng tròn chồng chéo lên nhau. Hình 
2.33(b) thể hiện một chữ “A” được in bằng máy in 24 kim tạo ra các 
điểm chồng chéo nhau. Thường một dòng phải được quét nhiều lần 
để sinh ra các điểm chồng chéo nhau, do đó chất lượng Ĩ 11 tăng lên 
nhưng đồng thời tốc độ in cũng giảm xuống. Các máy in ma trận 
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tốt có thể hoạt động với nhiểu chế độ đẻ điều hòa sự khác biệt giữa 
chất lượng in và tốc độ. 


Raised character 




Hình 2.32 I.a) Phan Ldl ngang tun máy m tac (tòng ib) Một bann xe loại 

vùng ( daisv \vheel I 


Raiseđ character : ký Lự núi 
Electromagnet for striking letter 
Paper : giấy 

Inked ribbon : ruv băng mực 
Pivot : chốt 

■ o _ 
o o 
o o 

o o 

o o o o o 

o o 

■ o o 

(») 


nam châm điện đê gõ ký Lự 



(b) 


Hình 2.33 (a) Chữ “A” trên một ma trận 5 X 7 (b) Chừ “A" được in với 

máy in 24 kim chổng chéo nhau 
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Máy in laser 

Có lẽ sự phát triến lý thú nhất về in. từ khi Johaann Gutenberg 
chẽ ra loại máy di động vào thế ký 15, là máy in laser ( laser 
printer ). Thiết bị này cho một hình anh chất lượng cao, có tính linh 
hoạt tuyệt hảo, tốc độ nhanh và làm giám giá thành thiêt bị ngoại 
vi. Các máy in laser hầu hết đều dùng k>' thuật giông như máy sao 
chép quang ( photocopy ), và chác chán chảng bao lâu nừa kỹ thuật 
này có thê sừ dụng được trong các máy kết hợp in và sao chép. Kỹ 
thuật cơ bản được minh họa trong hình 2.34. 

Phần chính cúa máy in là một tròng quay chính xác. Lúc bắt đáu 
mỗi trang in, trông được nạp điện áp 1000 volt và được phũ một 
chất cám quang. Sau đó ánh sáng từ một nguồn phát laser được quét 
dọc theo chiều dài trông như chùm tia điện tứ trong đèn hình CRT, 
nhưng thay vì dùng điện áp đè làm lệch ngang, người ta dùng một 
gương quay hình bát giác đè quét dọc theo chiều dài trông. Tia laser 
được điều chẽ đê sinh ra một mẵu các vệt sáng và tỏi. Các mẩu mà 
tia laser đập vào sẽ mất điện tích. 


( ZE> 


Laser 


O Rotatỉng oclagonal 
mirror 


oclagonal 


Drum sprayed and charged 



BEank 

paper 


Stacked 

output 


Hình 2.34 Hoạt động của một máy in laser 
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Laser : bộ phát tia laser 

Rotating octagonal mirror : gương bát giác quay 

Drum sprayed and charged ; trông đã được phun bột in và tích diện 

Ligth beam strikes drum : tia laser đên trông 

Drum : trống 

Toner : toner 

Scraper : bộ gạt 

Discharger ; bộ phóng điện 

Blank paper : giây trắng 

Heated rollers : các ru-lô nhiệt 

Stacked output : giây đã dược in 

Sau khi một dòng các điềm được quét, trông quay một phần của 
độ đế cho phép dòng kế tiếp được quét. Cuối cùng, dòng các điểm 
thứ nhất đạt đến toner, một hộp chứa bột đen nhạy cảm với tĩnh 
điện ( a reservoir of an electrostatically sensitive black powder ) mà 
ta gọi là bột in tỉnh điện. Bột in tĩnh điện bị hút bởi các điểm vẫn 
còn tích điện, vì thê hình thành một ảnh của dòng đó. Một lát sau 
trên đường truyền tải, trông đã phủ bột in tĩnh điện được ấn lên 
giấy và chuyển bột đen này lẽn giấy. Sau đó giây đi qua một cuộn ru 
lô nhiệt để chắc chắn kết dính bột in tĩnh điện lên giây, cô' định 
hình ảnh. ơ lần quay sau, trông phóng diện và làm sạch bột in tĩnh 
điện còn trên dó, chuẩn bị tích điện và phủ bột in lần nữa cho trang 
kế tiếp. 

Quá trình này là sự kết hợp cực kỳ phức tạp của kỹ thuật vật lý, 
hóa học, cơ khí và quang học. Tuy nhiên, khi được lắp ráp đầy đủ, 
người ta thường gọi là động cơ in ( print engine ). Các nhà chế tạo 
máy in laser kết hợp các động cơ in với một sô mạch điện tử và 
phần mềm riêng của họ đế tạo ra một máy in hoàn hảo. 

Cũng có thế sử dụng một loại động cơ in hơi khác không dùng 
tia laser, bằng cách gắn một hàng LED dọc theo chiều dài trống ( 
hoặc hướng tới trông qua sợi quang ). Phần mềm sè điều khiến các 
LED sáng và tắt để hình thành một dòng. Đây là một thiết kế 
quang đơn giản, nhưng cần nhiều mạch điện tử dế điều khiển các 
LED. 






Chương 2: Tổ chức hệ thống máy tính 


113 ỊSS 


Hai phương pháp khác để sắp đặt động cơ in vào trong một máy 
in hoàn hảo, Với phương pháp dầu, máy tính chỉ cho ra dạng văn 
bẩn thông thường với các lệnh chọn kiều chữ, vẽ đường thẳng, chữ 
nhật và hình tròn. Một máy tính bên trong máy in xây dựng một 
bản đồ bit ( bit map ) cho từng trang và chuyển tới máy in. Thuận 
lợi của phương pháp này là băng thông cần thiết, giữa máy in và 
máy tính rất thấp. Để in một trang 50 dòng 80 ký tự với một kiêu 
chữ, cần nhập 4000 byte. Một máy in có tốc độ in 12 trang / phút 
yêu cầu báng thông giữa máy tính và máy in là 6400 bps, trong khi 
đó đường truyền RS-232-C có thê làm việc với tõc độ 9600 bauđ. 
Điểm bất lợi là cần có một máy tính bên trong máy in. Để lưu giữ 
một bản đồ bit cho một trang kích thước 8,5 X 11 inch với 1 inch 
vuông có 300 X 300 điểm, ta cần 1 megabyte bộ nhớ trong máy tính. 

Để tránh tốn kém về máy tính và máy in, một sô hệ thống dùng 
máy tính và bộ nhớ bên trong máy tính đế xây dựng bản đồ bit, và 
chỉ chuyển ảnh bit thô ( chưa xử lý ) tới máy in. Phương pháp này 
làm cho máy in rẻ hơn nhiều, nhưng lúc này cần phải chuyến 1 
megabyte ảnh trong 5 sec, tốc độ dừ liệu là 1.6 megabit / sec. Do 
vậy, tốc độ máy in có thế bị chậm lại nêu tôc độ dữ liệu không đạt 
được yêu cầu này. 

Cũng có thế thiết kế một hệ thống dung hòa được 2 thái cực 
này, nhưng rõ ràng khi đi chuyển 600 điểm / inch hoặc cao hơn, 
người ta cần một lượng khá lớn bộ nhớ, công suât tính toán và băng 
thông. Đáng tiếc là các hệ thống sắp chữ in chuyên nghiệp cần từ 
1000 tới 2000 điểm / inch. Ta nhận thấy, máy quay phim có thê sao 
chép tài liệu để in dễ dàng bằng cách dùng máy in LED ( LED 
printer ) có dộ phán giải 450 điểm / inch. Nếu so sánh những tài 
liệu được sắp chữ in chuyên nghiệp, dùng một kính hiên VI công 
suất thấp, ta sẽ thấy sự khác biệt thật rõ ràng. Hy vọng là tính nội 
dung cao sẽ bù lại được độ phân giãi vật lý thâp cua tai liẹu. 

Máy in laser đã làm phát sinh một công nghệ hoàn toàn mới, 
gọi là desktop publishing ( dùng một máy tính nhỏ và một máy in 
laser để làm tài liệu in co chất lượng cao ). Máy Macintosh, IBM PC 
và những máy tính khác có phần mềm cho phép người sử dụng 
đánh các tài liệu và cho xuất hiện trên màn hình giống như dạng 
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xuất cuối cùng cùa chúng. Hệ thống này thường gọi là 1 WYSĨWYG, 
phát ám là “ wiz e wig “ f vvhat you see is what you get. ). Nhiêu hệ 
thông dịch văn bán nhập thành một ngôn ngừ trung gian gọi là 
PostScript, và sau đó nạp vào máy in laser. Trình phién dịch ( 
interpreter ) trong máy in đối ngôn ngữ PostScrip thành các pỉxeỉ 
và in chúng. PostScrip là một chuẩn quan trọng đối với máy in 
laser. 

Hiện nay ờ các máy tính cá nhân, máy in dược ghép với PC qua 
còng song song ( parallel port ) hay còn gọi là còng máy in ( printer 
port ) LPT. Giao tiếp qua cống máy in cho phép ta xuât đồng thời 8 
bit dữ liệu ra máy in nên tốc độ truyền nhanh. Các hệ thống khác 
truyèn dừ liệu qua cống máy Ì 11 có thế truyền một lần 4 bit ( xuât 8 
bit song song và nhận 4 bít song song ). 

Điẻu nãy xây ra do lúc ban dáu các IBM-PC không quan tám đến 
vấn dề nhập dử liệu qua cống máy in và gọi các cống này là cổng 4 
bit. Khi các hệ thõng PS/2 xuất hiện, IBM đưa ra các cổng song 
song s bit rồi sau đỏ các cống song song 8 bit sứ dụng kỹ thuật truy 
xuất trực tiếp bộ nhớ DMA ( direct access memory ). Tuy nhiên 
chúng lại không được hỗ trợ trong các PC chuẩn. 

Cấu hình cùa các cổng song song không phức tạp như các cổng 
nối tiếp. Các IBM-PC ngay từ ban dầu đã có phần mềm hệ xuất 
nhập cơ bán BIOS í basic input output System ) cũng như hệ điều 
hành DOS hỗ trọ' cho 3 cống máy in Bảng ỡ hình 2.35 trình bày các 
địa chi I/O và các ngắt chuấn cho của cống song song. 


Hệ thông bưs 

LPT chuấn 

LPT thay thế 

Địa chi cống 

Ngất 

8/16 bit ISA 

LPT1 

— - 

3BC1I 

1RQ7 

8/16 bít ISA 

LPT2 

LPTI 

378H 

IRQ5 

8/16 bít ISA 

LPT2 

LPT2 

278H 

Không có 


Hình 2.35 Các địa chí I/O và các ngất chuầi*cùa cống song song 
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Hiện nay các cổng song song không chi sứ dụng đẻ' ghép nối với 
máy in mà còn ghép nôi với các thiẽt bị khác như các thiết bị lưu 
trừ, LAN adaptor, CD-ROM và cả các modem. 

Các cống song song tàng cường EPP ( enhanceđ parallel port }, 
các cõng có các khá năng tàng cường ECP ( enhanced capabilitics 
port ) giúp ta nảng tốc độ truyền lẻn 2 MB / sec thay vì là 40-60 KB 
/ sec và 80-300 KB / sec ờ các cống song song 4 bit và 8 bit. Các 
cổng EPP và ECP dược các công ty Microsoft và Hevvdett Packard 
hợp tác phát triển. Các PC có những chip "super I/O ( SIO )" có thế 
hỗ trợ EPP và ECP. Cả 2 cổng này đều được xác định theo ehuân 
IEEE 1284 { đây là chuẩn giao tiêp các thiêt bị ngoại vi song song 
hai chiều cho máy tính cá nhân, xác định các tinh chất vật lý của 
công, các chê độ truyền dừ liệu, các tiêu chuẩn về điện V.V.. ), EPP 
được thiẻt kế cho LAN adaptor, các ố đĩa và các thiết bị lưu trữ dự 
phòng trong khi ECP thiết kế cho các máy in tốc độ cao và có sứ 
dụng kênh DMA. 

. 2.3.5 Các mã ký tự 

Mỗi máy tính đều có một bộ ký tự. Bộ ký tự tối thiếu bao gồm 
26 chữ hoa, 10 số từ 0 tới 9 và một vài dấu chấm cáu như dâu cách, 
dấu chấm, dấu trừ, dấu phây và trờ về đầu dòng. Nhiều bộ ký tự 
phức tạp hơn gồm cá chữ hoa và chừ thường, 10 con số, và nhiều 
loại dấu chấm câu, một sưu tập các ký tự đặc biệt dùng trong toán 
học và thương mại. 

Để chuyên những ký tự này vào máy tính, mỗi ký tự được gán 
một sô : thí dụ a = 1, b = 2, z = 26, + = 27, - = 28. Việc ánh xạ 
các ký tự trên các sò nguyên cho ta bộ mã ký tự { character code ). 
Các máy tính hiện nay dùng các loại mã 6, 7, 8 hoặc 9 bit. Một mã 
6 bit chỉ cho phép mã hóa 2 H = 64 ký tự, đó là 26 chữ cái, 10 con số 
và 28 ký tự khác ( hầu hết là các dấu chấm cáu và ký hiệu toán học 

). 

Trong nhiều ứng dụng 64 ký tự không đủ, trong trường hợp đó 
người ta mà hóa một ký tự bằng 7 hoặc 8 bit. Một bộ mã ký tự 7 bit 
cho phép mã hóa đến 128 ký tự. Bộ mã 7 bit được sử dụng rộng 
rãi gọi là bộ mã ASCII, bộ mà chuấn của Mỹ trong trao đối thông 
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tin ( american Standard code for iníbrmation interchange ). Bộ mã 
ký tự 8 bit là bộ mã IBM EBCDIC được sử dụng trên các mainframe 
lớn. Thật ra bộ mã EBCDIC đã lỗi thời, nhưng vì tính kêt hợp được 
nên người ta đã gắn IBM với bộ mã này. 

2.4 TÓM TẮT 

Các hệ thống máy tính được xảy dựng từ 3 thành phần: bộ xử lý, 
bộ nhớ và các thiết bị xuất nhập. Bộ xử lý có nhiệm vụ tim-nạp 
từng chí thị một kế tiếp nhau từ bộ nhớ, giải mã chúng và thực thi 
chúng. Chu kỳ tìm nạp - giải mấ - thực thi luôn được mô tả như một 
thuật toán và thực tế, thường được tiến hành bới một trình phiên 
dịch chạy trên cấp máy thấp hơn. 

Các hệ thống có khá năng thực thi song song các chỉ thị đang 
càng ngày càng trở nên phổ biến. Các máy tính song song loại 
SIMD bao gồm các bộ xử lý vector và dày các bộ xử lý. Các máy loại 
MIMD có bộ đa xử lý sứ dụng nhiều sơ đồ khác nhau để kết nối các 
bộ xứ lý và bộ nhớ. 

Bộ nhớ được phân làm 2 loại, bộ nhớ chính và bộ nhớ phụ. Bộ 
nhớ chính dùng để chứa chương trình hiện đang được thực thi, có 
thời gian truy xuất ngắn, nhiều nhát là vài trăm nanosec và dộc lập 
với địa chi đang được truy xuâT Nhiều bộ nhớ được trang bị thêm 
các mã sứa lỗi để làm tăng độ tin cậy. Trái lại, các bộ nhớ phụ có 
thời gian truy xuất dài hơn nhiều và tùy thuộc vào vị trí dữ liệu 
đang được đọc hay ghi. Băng từ, đìa từ và đĩa quang là các bộ nhớ 
phụ thông dụng nhất. 

Các thiết bị I/O được dùng đế truyền thông tin vào và ra máy 
tính. Thí dụ các thiết bị đầu cuối, chuột và các máy in laser. Trên 
các mainírame, các thiết bị I/O được nối với các kênh dừ liệu. Trên 
những máy tính nhỏ hơn, chúng được điều khiển bởi các bộ điều 
khiển nốì trực tiếp với bus hệ thống. Các thiết bị I/O thông dụng 
bao gồm thiết bị đầu cuối, modem, chuột và máy in. Đa số các thiết 
bị I/O đều dùng bộ mã ASCII, trừ các mainírame của IBM sử dụng 
bộ mã EBCDIC. 
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Các máy tính được xây dựng từ nhừng chip mạch tích hợp chứa 
các phần tử chuyển mạch rất nhỏ gọi là cống. Nhừng cổng thường 
dùng nhất là AND, OR, NAND, NOR và NOT. Các mạch logic đơn 
giản được xây dựng bằng cách tổ hợp trực tiếp các cổng riêng rè 
trong các chip có độ tích hợp thấp SSI. 

Các mạch logic phức tạp hơn được xây dựng từ những chip có độ 
tích hợp trung bình MSI chuẩn như : mạch chọn kênh ( multi-plexer 
), mạch phân kênh { de-multiplexer ), mạch mà hóa ( en-coder ), 
mạch giải mã ( decoder ), mạch dịch bít ( shiíter ) và ALU. Cũng có 
thể lập trình cho một dãy logic lập trình được PLA ( pro-grammable 
logical array ) đế có các hàm đại sô' logic tùy ý. Khi cần nhiều hàm 
đại sô' logic, việc sứ dụng các PLA mang lại hiệu quả cao hơn nhiều 
so với việc sử dụng các chip SSI. 

Phép toán số học của máy tính được thực hiện bằng các mạch 
cộng. Mạch cộng toàn phần 1 bit ( full adder ) có thề được xây dựng 
từ 2 mạcbr cộng bán phần 1 bit ( half adder ). Mạch cộng một từ 
nhiều bit ( multibit word ) được xây dựng bằng cách nối nhiều mạch 
cộng toàn phần 1 bit. 

Những bộ nhớ được sử dụng trong máy tính là RAM, ROM, 
PROM, EPROM và EEPROM. Các bộ nhớ RAM tĩnh SRAM ( static 
RAM ) không cần làm tươi ( reíresh ) nhưng các bộ nhớ RAM động 
DRAM ( dynamic RAM ) cần phải làm tươi theo chu kỳ để bù lại sự 
rò rỉ do các tụ điện ký sinh trên chip gây ra. 
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Toàn bộ các khái niệm trên thường được tìm thây trong các sách 
và tài liệu về kỷ thuật sô, về mạch số, do vậy ta không đề cập lại ở 
đây. Nội dung chính của chương này đề cập đến các vấn dề về đơn 
vị xử lý trung tâm CPU ( Central Processing unit ) và đặc biệt là 
cách một chip CPU giao tiếp với bộ nhớ và các thiêt bị ngoại vi. 

3.1 CÁC CHIP VI XỬ LÝ VÀ CÁC BUS 

Trong phần này, trước tiên chúng ta xem xét một sô' khía cạnh 
chung của các bộ vi xứ lý ( microprocessor ) từ góc cạnh câp logic sô, 
kể cả các chân ra ( pinout ) ( ý nghĩa cúa các tín hiệu trén các chân 
khác nhau ). Vì các bộ vi xử lý liên quan rât chặt chè dên việc thiêt 
kê các bus chúng sử dụng, chúng ta cũng giới thiệu về thiêt kê bus 
trong phần này. Các phần kế tiếp sè dưa ra các thí dụ chi tiết cho 
các bộ vi xử lý và các bus. 

3.1.1 Các chip vi xử lý 

Xuất phát từ các mục đích của quyển sách này, chúng ta sẽ dùng 
thuật ngừ “ bộ vi xứ lý ” để diễn tả một CPU bâ't kỳ chứa trong một 
chip, mặc dù một sô' CPU có cấu trúc và công suất tính toán của một 
mainframe nhỏ. Định nghĩa của chúng ta dựa trẽn sự đóng gói 
( packaging ), phù hợp với cấp logic sô dang nghiên cứu. 

Chúng ta sẽ tập trung vào các CPU chứa trong một chip đơn với 
lý do sự giao tiếp của các CPU này với phần còn lại cùa hệ thống 
được xác định rõ. Các chip vi xử lý tiêu biểu có khoảng từ 40 đến 
300 chân, qua các chân này, tất cả thông tin cùa chúng với thế giới 
bên ngoài đều thực hiện được. Một sô chân xuất các tín hiệu từ 
CPU, một số khác nhận tín hiệu vào từ bên ngoài và mộtrsố có thé 
thực hiện được ca 2 chức năng này. 

Bằng cách hiểu rõ chức năng cùa từng chân, chúng ta có thể biết 
được bằng cách nào CPU có thế tác động qua lại với bộ nhớ và các 
thiết bị I /o ở câ'p logic số. Mặc dù tài liệu sau đây liên quan cụ 
thể đến các bộ vi xử lý, các ý tưởng cơ bản như cách thức các CPU 
tham khảo bộ nhớ, cách thức các CPU giao tiếp với các thiết bị I/O 
V.V. .. cũng liên quan đến các máy tính mini ( minicomputer ) và 
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trong phạm vi nào đó liên quan đèn các mainírame, tuy ỡ dạng hơi 
khác. 

Các chân trên một chip vi xừ ỉý được chia thành 3 loại chính : 
địa chỉ, dừ liệu và điều khiển. Những chân này được nối đến các 
chân tương tự trên các chip bộ nhớ và các chip I/O thông qua một 
tập hợp các đường song song gọi là bus. Để tìm-nạp một chỉ thị, 
trước tiên bộ vi xử lý đặt địa chí bộ nhớ cùa chi thị đó lên các chân 
địa chi. Sau đó bộ vi xứ lý xác lập (. chuyến trạng thái từ thụ dộng 
sang tích cực ) một đường điều khiến đề thông báo cho bộ nhớ rằng 
muôn đọc một từ. Bộ nhớ trả lời bằng cách đưa từ được yêu cầu 
( requested word ) lên các chân dừ liệu cũa bộ vi xứ lý và xác lập 
một tín hiệu cho biết yèu cầu dã được thực hiện. Bộ vi xữ lý thấy tín 
hiệu này sẽ nhận từ yêu cầu và thực thi chi thị. 

Chì thị có thể yêu cầu đọc hoặc ghi các từ dừ liệu, trong trường 
hợp này toàn bộ quá trình được lặp lại cho mồi từ thèm vào. Chúng 
ta sẽ đi vào chi tiết cách đọc và ghi ỡ phần dưới, vào thời điếm này, 
điểu quan trọng cần quan tám là CPU truyền thông tin với bộ nhớ 
và các thiết bị I/O bằng cách đưa các tín hiệu ra và nhận các tín 
hiệu vào trẽn các chân. Không có cách truyền thông tin nào khác. 

Đến đáy có một lưu ý về mặt thuật ngữ. Trên một số chân, mức 
điện áp cao { +5 volt ) của tín hiệu sè gây ra một tác động. Trên một 
sỏ" chân khác, mức điện áp của tín hiệu tạo ra một tác động lại là 
mức thấp. Để tránh nhầm lẫn, chúng ta sè thống nhất nói rằng tín 
hiệu được xác lập ( asserted ) ( hơn là nói tín hiệu chuyển thành 
mức cao hoặc mức thấp ), nghĩa là tín hiệu chuyển trạng thái từ thụ 
động sang tích cực dế tạo ra một tác động. Vì thế đô'i với một sô' 
chân, xác lập có nghĩa là được thiết lập ỡ mức cao và đối với một số 
chân khác, được thiết lập ỡ mức thấp. Những chân được xác lập ở 
mức thấp, tên các tín hiệu có thêm một gạch ngang ở trên. Vì vậy 
WRITE được xác lập ớ mức cao, còn WRITE được xác lập ớ mức 
thấp. Ngược với xác lập là không xác lập ( negated ). Khi một tín 
hiệu ớ trạng thái thụ động, không tạo ra một tác động nào, chân 
tương ứng hay tín hiệu là không xác lập. 
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Có 2 thông sô chính để xác định hiệu suất ( perĩormance ) của 
một bộ vi xử lý, đó là sô" chân địa chỉ và sô chân dữ liệu. Một chip 
với m chân địa chỉ có thể địa chỉ hóa ( address ) dên 2 m byte bộ 
nhớ, nghĩa là định địa chỉ cho tôi đa 2 m byte bộ nhớ. Các giá trị 
thường dùng của m là 16, 20, 24, 32 và 36. Tương tự, một chip với n 
chân dữ liệu, có thể đọc hoặc ghi một từ ( word ) rc-bit với một thao 
tác đơn. Các giá trị thường dùng của n là 8, 16, 32 và 64. Một bộ vi 
xứ lý có 8 chân dữ liệu, sẽ mất 4 thao tác ( operation ) để đọc một từ 
32-bit, trong khi dó bộ vi xử lý có 32 chân dữ liệu thực hiện cùng 
công việc đó chỉ với 1 thao tác. Vậy chip có 32 chân dừ liệu sẽ xử lý 
nhanh hơn nhiều, nhưng bao giờ cũng đắt hơn. 

Ngoài các chân địa chỉ và dừ liệu, mỗi bộ vi xử lý còn có một số 
chân điều khiển. Các chân điều khiển điều hòa dòng dữ liệu và định 
thì cho dữ liệu đến hoặc từ bộ vi xử lý, và có các công dụng linh tinh 
khác. Bộ vi xử lý nào cùng có chân cấp nguồn ( thường là 5 volt hay 
thấp hơn ), chân tiếp đất và chân tín hiệu clock dạng xung vuông ( 
ta gọi là xưng clock ). Các chân khác có công dụng thay đổi tùy theo 
các chip vi xử lý khác nhau. Tuy vậy, các chân điều khiển có thể 
được nhóm thành các loại chính như sau: 

1. Điều khiến bus ( bus control ). 

2. Xử lý ngắt ( interrupt ). 

3. Phân xử bus ( bưs arbitration ). 

4. Báo hiệu với đồng xử lý ( coprocessor signaling ). 

5. Trạng thái { status ). 

6. Các tín hiệu khác. 

Chúng ta sẽ mô tả tóm tắt từng loại trong các mục dưới đây. 
Nhiều thông tin chi tiết hơn sẽ được cung cấp khi xem xét các chip 
của Intel và Motorola sau này. Một chip CPU tổng quát sử dụng các 
nhóm tín hiệu trên được trình bày trong hình 3.1. 

Hầu hết các chân điều khiển bus là các njgÕ ra từ bộ vi xử lý tới 
bus ( vậy thì chúng là các ngõ vào đối với các chip bộ nhớ và các 
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chip I/O ), cho biêt bộ vi xử lý hoặc muôn đọc bộ nhớ hoặc muôn ghi 
bộ nhớ hoặc làm một điều gì khác. 


Addrestlng < Ịt 

Data < >‘ | 

Bus control « 

——I 

Intemipts ! 




>lcal 
icro- 
Processor 


Bus arbitration 

Coprocessor 

Status 

Mlscellaneous 


11 "ÍT 


V 


Symbol for 


ỉymi 

eíectrlcal ground 


<1» +5v 
Symbol / * 

f< slgríaỉ k Power Is 5 volts 


Hình 3.1 Các chân ra ( pinout ) logic của một bộ vi xứ ly diển hình. Các 
mũi tên cho biết tín hiệu vào hoặc ra. Các đường gạch chéo ngăn chu biết 
nhiều chân dược sử dụng. Với một bộ vi xử lý đặc thù, con số trẽn dường 

này cho biết có bao nhiêu chân. 

Addressing : các chân địa chỉ hóa bộ nhớ 
Data : các chân dữ liệu 
Bus control : các chân điều khiển bus 
Interrupts : các chân ngắt 

Symbol for clock signal : ký hiệu cho tín hiệu clock 

Bus arbitration : các chân phân xử bus 

Coprocessor : các chân báo hiệu với đồng xử lý 

Status : các chân trạng thái 

Miscellaneous : các chân linh tinh 

Symbol for electrical ground : ký hiệu chân tiêp đât 

Power is 5 volts : điện áp nguồn là 5 volt 

Các chân xử lý ngắt là các ngõ vào từ thiết bị I/O tới bộ vi xử lý. 
Trong hầu hết các hệ thống, bộ vi xử lý có thể yêu cầu một thiết bị 
I/O khởi động, sau đó chuyển sang thực hiện một công việc hữu ích 
khác trong khi các thiết bị I/O tốc độ chậm vẫn đang thực hiện công 
việc của chúng. Khi I/O đã hoàn tất công việc, chip điều khiển I/O 
xác lập một tín hiệu trên một trong số các chân xử lý ngắt để 
neắt CPU và yêu cầu CPU phục vụ thiết bị I/O, thí dụ như kiểm tra 
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xem có lỗi 1/0 nào xáy ra hay không. Một số bộ vi xử lý có một ngõ 
ra dùng đè trá lời tín hiệu yẽu cầu ngắt. 

Các chân phân xứ bus được cần đến đế điều hòa lưu lượng thông 
tin trên bus, nhằm tránh trường hợp 2 thiết bị cùng sứ dụng bus 
đồng thòi. Với mục đích phân xứ bus, CPU cùng được xem như một 
thiết bị. 

Nhiều chip vi xứ lý được thiết kế đế hoạt dộng với các bộ đồng 
xư lý, hầu hết là các chip dấu chấm động < íloating-point ), nhưng 
đỏi khi là chip đồ họa ( graphic ) hoậc là các chip khác. Đê bộ vi xử 
lý và bộ đồng xử lý thông tin với nhau dễ dàng, người ta cung cấp 
những chân đặc biệt đế tạo ra và chấp nhận những yêu cầu khác 
nhau. 

Ngoài những chân tín hiệu này, các bộ vi xứ lý còn có nhiều 
chán linh tinh khác. Một số chân cung cấp hoặc nhận các thông tin 
trạng thái, một sò khác dùng cho việc reset máy tính ( lập lại trạng 
thái ban đầu cho máy tính ) và số chán khác nữa dùng đê đám báo 
sự tương thích với các chip I/O cũ. 

3.1.2 Các bus của máy tính 

Một bus là một nhóm các dường dấn chung giữa nhiều thiết bị. 
Một thí dụ phố biến là bus hệ thông ( System bus ) hiện có trẽn tất 
cá máy vi tính, bao gồm từ 50 đến trẽn 100 dường đồng dược khắc 
song song trẽn board mẹ, với các đầu nối ( connector ) đặt ờ những 
khoáng cách đều nhau đế cắm các board bộ nhớ và các board I/O. 
Tuy nhiên, các bus cũng được dành cho những mục đích đặc biệt như 
là kết nối một bộ vi xứ lý với 1 hoặc nhiều bộ đồng xử lý, hoặc với 
các bộ nhớ cục bộ ( local memory ). Hơn nữa, trong một chip vi xử lý 
cùng có nhiều bus dế kết nối các thành phần bén trong, như minh 
họa trong hình 3.2. Trong tài liệu, đôi khi bus được vè giông các mũi 
tên lớn trong hình vẽ này. 

Trong khi những nhà thiết kế bộ vi xứ lý được tự do sử dụng 
bất kỳ loại bus nào họ muốn ơ bên trong chip, để có thể nối các 
board được thiết kế với bus hệ thống phái có nhừng quy luật xác 
định rõ ràng vể cách làm viêc của bus. Tất cả thiết bi nối với bus 
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đều phải tuân theo các qui luật này. Những quy luật như vậy được 
gọi là nghi thức bus ( bus protocol ). Ngoài ra, phải có thêm các chỉ 
tiêu kỹ thuật về điện và cơ đế các board gắn thêm sẽ đặt vừa trong 
khung chứa card ( card cage ) và các đầu nối phải phù hợp với các 
rãnh cắm trên board mẹ, cá về tính vật lý và điện áp. 


CPU 




On<chip bus 


1/0 

board 


1/0 

board 


Local 

bus 


Memory 

board 


Hình 3.2. Hệ thống may tính có nhieu bus. 

CPU : đơn vị xứ lý trung tâm 
Buses : các bus 
Registers : các thanh ghi 
ALƯ : đơn vị số học logic 
On-chip bus : bus trên chip 
System bus : bus hệ thông 
Memory board : board bộ nhớ 
1/0 board : boarđ xuát / nhập 
Local bus : bus cục bộ 
Coprocessor : bộ dồng xứ lý 
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Nhiều bus đã được sử dụng phổ biến trong thế giới máy tính. 
Một sô' bus nổi tiếng như : Camac bus ( vật lý hạt nhân ), EISA bus 
(80386), Fastbus ( vật lý năng lượng cao ), các bus của IBM PC và 
PC AT ( IBM PC and PC AT bus ) , Massbus ( PDP-11, VAX ), 
Megabus ( Honeywell ), MicroChannel ( PS/2 ), Multibus I ( 8086 ), 
Multibus II ( 80386 ), Nubus ( Macintosh II ), Omnibus ( PDP-8 ), 
Qbus ( LSI-11 ), S-100 bus ( hobby Computer ), SBI ( VAX-11/780 ), 
Ưnibus ( PDP-11 ), Versabus ( Motorola ) và VME bus ( 680x0 ). 

Đáng tiếc là việc tiêu chuẩn hóa trong lãnh vực này dường như 
rất khó có thể xảy ra khi dã CÓ quá nhiều đầu tư cho nhừng hệ 
thông không tương thích này. 

Một sô" bus đã và đang sử dụng hiện nay trên các máy tính cá 
nhân, chủ yếu là các máy tính của IBM và tương thích sử dụng các 
chip vi xử lý của Intel, sẽ được đề cập cụ thể trong phần các thí dụ 
về bus. 

Bây giờ chúng ta bắt đầu nghiên cứu về cách làm việc của bus. 
Một sô thiêt bị ( từ thiêt bị được dịch từ chữ device, dùng chỉ chung 
các thành phần cấu tạo nên một hệ thống máy tính ) nối với bus là 
các thiêt bị tích cực { active ) có thể khởi động việc truyền trên bus, 
trái lại một số khác là các thiết bị thụ động ( passive ) chờ các yêu 
cầu. 

Thiết 'bị tích cực gọi là thiết bị chủ bus hay thiết bị chủ ( 
master ), thiết bị thụ động gọi là thiết bị phụ thuộc bus hay thiết bị 
phụ thuộc ( slave ). 

Khi CPU ra lệnh bộ điều khiển đĩa đọc hoặc ghi một khôi dữ 
liệu, CPU đóng vai trò một thiết bị chủ và bộ điều khiển đỉa hành 
động như một thiết bị phụ thuộc. Tuy nhiên, vào thời điểm sau, bộ 
điều khiển đĩa trở thành thiết bị chủ khi yêu cầu bộ nhớ nhận các 
từ dữ liệu đọc từ ổ đĩa. 

Vài kết hợp điển hình giữa thiết bị chủ và thiết bị phụ thuộc 
được liệt kê trong hình 3.3. Không có trường hợp nào bộ nhớ hoạt 
động như một thiết bị chủ. 
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Thiết bị chủ 

Thiết bị phụ thuộc 

Thí dụ 

CPU 

Bộ nhớ 

Tim nạp các chỉ thị và dữ liệu 

CPU 

I/O 

Khđi động việc truyền dữ liệu 

CPU 

Bộ đồng xứ ỉý 

Thực hiện các lệnh trên sô dấu châm dộng 

I/O 

Bộ nhớ 

Truy xuảt trực tiếp bộ nhớ ( DMA ) 

Bộ đồng xử lý 

Bộ nhớ 

Tìm nạp các toán hạng 


Hình 3.3 Các thí dụ về thiết bị chủ và thiết bị phụ thuộc 

Các thành phần của máy tính thường xuất các tín hiệu nhị phân 
có dòng không đủ mạnh để cung cấp cho bus, đặc biệt nếu bus tương 
đôi dài hoặc có nhiều thiết bị nô'i với bus. Vì lý do này, hầu hết các 
thiết bị chủ đều được nôi với bus qua một chip gọi là bộ kích bus ( 
bus driver ), bộ kích bus chủ yếu là một mạch khuếch đại tín hiệu 
sô'. Tương tự, hầu hết các thiết bị phụ thuộc đều được nối tới bus qua 
một bộ thu bus ( bus receiver ). Đôi với các thiết bị có thể hoạt động 
ở cả 2 vai trò chủ và phụ thuộc, một chip kết hợp gọi là bộ thu phát 
bus ( bus transceiver ) được dùng đến. 

Các chip giao tiếp bus này ( bus interíace chip ) thường là thành 
phần có ngõ ra ba trạng thái ( tri-state output ), cho phép thả nổi 
không kết nôi ( disconnect ) khi không cần đên, hoặc là thành phần 
có các ngõ ra cực thu hở ( open collector output ) nhằm đạt được 
cùng một hiệu quả. Khi có 2 hoặc nhiều thiêt bị cùng xác lập các 
ngõ ra đồng thời trên một đường cực thu hớ, kêt quả là tất cả các 
tín hiệu được OR với nhau. Sự sắp xếp này gọi là OR nối dây ( 
wired-OR ). Trên hầu hết các bus, một số đường được thiết kế có 3 
trạng thái và một số khác, cần đặc tính OR nối dây, có cực thu hở. 

Giống như bộ vi xử lý, bus cùng có các đường địa chỉ, dừ liệu và 
điều khiển. Tuy nhiên không nhất thiết phải có một ánh xạ 1-1 
giữa các tín hiệu của bộ vi xử lý và của bus. Thí dụ, một số bộ vi xử 
lý dùng 3 chán tín hiệu để mã hóa các thao tác : đọc bộ nhớ, ghi bộ 
nhớ, đoc I/O, ghi I/O hoặc một sô' thao tác khác. Bus tiêu biểu có 
một đường điều khiển đọc bộ nhớ, một đường điều khiển ghi bộ 
nhớ, một đường điều khiển đọc I/O, một đường điều khiển ghi I/O 
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v.v... . Một chip giải mã cần có giữa CPU và một bus như vậy để 
chuyên đối tín hiệu mã hóa 3 bit thành các tín hiệu riêng biệt có 
thế điều khiển các đường bus. 

Các vân đề chính trong việc thiêt kẽ bus ( ngoài sô đường địa 
chi và đường dữ liệu ) là đồng bộ ( clocking ) bus, cơ chê phân xử 
bus, xử lý ngắt và xử lý lỗi. Nhừng vân đề này ảnh hưởng nghiêm 
trọng đến tốc độ và băng thông của bus, chúng ta sẽ nghiên cứu kỹ 
chúng trong phần sau. 

3.1.3 Bus đổng bộ 

Các bus có thể chia thành 2 loại riêng biệt tùy thuộc vào phương 
pháp đồng bộ của chúng. Loại bus đồng bộ ( synchronous bus ) có 
một đường được cấp tín hiệu từ một bộ dao động dùng thạch anh. 
Tín hiệu trẽn đường này là một sóng vuông có tần sô' thường nằm 
trong khoảng 5 MHz và 100 MHz gọi là xung clock. Tât cả hoạt 
động trên bus, gọi là chu kỳ bus ( bus cycle ), đều chiếm một số 
nguyên chu kỳ xung clock. Loại bus kia, bus không đồng bộ ( 
asynchronous bus ), không có xung clock chủ. Chu kỳ bus có thể có 
chiều dài bất kỳ theo yêu cầu, không cần phái giống nhau giừa tất 
cả các cặp thiết bị. Sau đây chúng ta sẽ lần lượt kháo sát từng loại 
bus này. 

Đề biết cách làm việc của một bus đồng bộ, ta hãy khảo sát 
giản đồ thời gian ơ hình 3.4(a) làm thí dụ. Trong thí dụ này, xung 
clock có tần sô 4 MHz nên một chu kỳ dao động sẽ dài 250 nsec. 
Giả thiết rằng việc đọc một byte từ bộ nhớ mất 3 chu kỳ dao động, 
tổng cộng 750 nsec từ lúc bắt đầu chu kỳ T] đến khi kết thúc chu 
kỳ T;j. Ta cũng giả thiết phải mất 10 nsec đế tín hiệu thay đổi từ 
mức thấp sang mức cao hoặc ngược Lại. Các đường xung clock, địa 
chỉ, dữ liệu, yêu cầu bộ nhớ MREQ ( memory request ) và điều 
khiển đọc RD ( read ) đều được thể hiện theo cùng một tỉ lệ thời 
gian. 

Chu kỳ T] dược bắt đầu bởi cạnh lẽn của xung clock. Một 
khoáng thời gian sau cạnh lên cúa Tị, CPU đặt địa chỉ của byte 
muốn đọc trong b ộ nhớ lên các đường địa chỉ. Do có nhiều đường 
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địa chí, không phái một như xung clock, nén không thế biếu diễn 
chúng như là một đường đơn trong hình vẽ, thay vào đó là 2 đường 
và chúng cắt chéo nhau tại thời điểm thay đổi địa chỉ. Ngoài ra, 
phần vệt mờ ngay trước 2 đường chéo cắt nhau cho biết giá trị ỡ 
phần vệt mờ không quan trọng hoặc không có giá trị sử dụng. Bằng 
cách dùng quy ước như vậy ta sẽ thây không có nội dung nào của cac 
đường dừ liệu có ý nghĩa cho đến khi vào chu kỳ T; ( . 

Sau một khoáng thời gian sao cho các đường địa chỉ ổn định giá 
trị mới, MREQ và RD được xác lập. Tín hiệu MREQ cho biết bộ 
nhớ, không phái thiêt bị I/O, đang được truy xuãt và tín hiệu RD 
giúp phân biệt việc đọc với việc ghi. Không có gì xáy ra trong suốt 
chu kỳ T 2 , thời gian này dành cho bộ nhớ đè giải mà địa chi và dưa 
dữ liệu lên bus. ơ cạnh xuống cùa chu kỳ T 3 , CPU đọc các đường dử 
liệu và cất giá trị vào một thanh ghi nội. Khi đã đọc dử liệu, CPU 
không xác lập các đường tín hiệu MREQ và RD. Nếu cần, một chu kỳ 
bộ nhớ khác có thế bắt đầu ờ cạnh lên kế cùa xung clock. . 

Trong bảng đặc tính thời gian ( timing speciíìcation ) ỏ' hình 
3.4(b), 8 ký hiệu trong giản dồ thời gian ( timing diagram ) được giải 
thích rõ hơn. Thí dự Tao là khoáng thời gian giữa cạnh lên cũa xung 
clock Tị và thời điểm các đường địa chỉ đã được thiết lập ổn định. 
Theo báng đặc tính thời gian, Tao £110 nsec. Điều này có nghĩa là 
nhà sản xuất chip phải đám bảo rằng trong thời gian của bất kỳ chu 
kỳ đọc toán hạng nào, CPU cũng phải xuất địa chỉ cùa toán hạng 
trong khoảng thời gian 110 nsec kê từ điểm giữa ớ cạnh lén cùa 
xung clock Tl. 

Báng đặc tính thời gian cùng yêu cầu dữ liệu phải có giá trị sứ 
dụng trên các đường dữ liệu ít nhất 50 nsec trước khi xuất hiện 
cạnh xuống cúa xung clock T ;J , đê dừ liệu có thời gian ổn định trước 
khi CPU đọc. Kết hợp các ràng buộc trên T A 1 ) và T nS) trong trường 
hợp xâu nhát, bộ nhó' chí có 250 + 250 + 125 - 110 * 50 = 465 nsec 
từ thời điếm địa chi xuất hiện cho đến khi bộ nhớ phái xuất dữ liệu 
lên bus. Nếu bộ nhớ không đáp ứng đủ nhanh, bộ nhớ xác lập 
đường tín hiệu WAIT ( khỏng thể hiện trên hình vẽ ) trước cạnh 
xuống của xung clock T2 khi WAIT được chốt. Tác động này chèn 
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thêm các trạng thái chờ ( wait State ) vào chu kỳ đọc bộ nhớ cho tới 
khi bộ nhớ hoàn tất công việc và không xác lập đường tín hiệu 

WAIT. 


Bảng đặc tính thời giam còn đảm bảo địa chỉ sẽ được thiêt lập ít 
nhất 60 nsec trước khi MREQ được xác lập. Thời gian nàysẽ quan 
trọng nếu tín hiệu MRẼQ tác động lên chân chọn chip cs ( chip 
select ) của chip bộ nhớ bởi vì một sô bộ nhớ yêu cau thơi gian thiet 
lập địa chỉ phải xảy ra trước thời điểm chọn chip. Rõ ràng người 
thiết kê máy vi tính không nên chọn một chip bộ nhớ có thời gian 
thiết lập địa chỉ là 75 nsec. 


Read cycle 



Hình 3.4(a) Giản đồ thời gian đọc dữ liệu trên bus đồng bộ. 

Read cycle : chu kỳ đọc 

<t> : xung clock 

Address : dịa chỉ 

Data : dữ liệu > 

MREQ : tín hiệu yêu cầu bộ nhớ 
RD : tín hiệu điều khiển đọc 

Memory address to be read : địa chỉ bộ nhớ dã ổn định 
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Với sự ràng buộc trên T M và Trl, cả 2 tín hiệu MREQvà RD sẽ 
được xác lập trong khoảng thời gian 85 nsec kể từ cạnh xuống của 
xung clock Tl. Trong trường hợp xấu nhất, chip bộ nhớ sẽ chỉ có 
250 + 250 - 85 - 50 = 365 nsec sau khi MREQvà RD xác lập để đưa 

dừ liệu từ bộ nhớ lên bus. Sự ràng buộc này được cộng thêm vào sự 
ràng buộc trên địa chỉ. 

Thời gian Tmh và Trh cho biết phải mất bao lâu để MREQ và RD 
không còn xác lập sau khi dữ liệu đã được đọc. Cuối cùng, T D h cho 
biết phải duy trì dữ liệu trên bus bao lâu sau khi RD không còn xác 
lập. Bộ nhớ có thể loại bỏ dữ liệu ra khỏi bus ngay khi RD không 
còn xác lập, tuy nhiên đối với một số bộ vi xử lý trong thực tế, dừ 
liệu phải được duy trì ổn định trên bus lâu hơn một chút. 


Ký hiệu 

Thông sô' 

Min 

Max 

Đơn vị 

Tad 

Trì hoãn dịa chỉ 


110 

Nsec 

Tml 

Địa chí ổn định trước MREQ 

60 


Nsec 

Tm 

Trì hoãn MREQ kề' từ cạnh xuống Tl 


85 

Nsec 

Trl 

Trì hoán RD kể từ cạnh xuống của TI 


85 

Nsec 

Tds 

Thời gian thiết lập dừ liệu trước cạnh xuống 
T3 

50 


Nsec 

Tmh 

Trì hoãn MREQ kể từ cạnh xuỏ'ng của T3 


85 

Nsec 

Trh 

Trì hoãn RD kể từ cạnh xuống của T3 


85 

Nsec 

Tdh 

Thời gian lưu giữ dữ liệu sau khi RD không 
xác lập 

0 


Nsec 


Hình 3.4(b) Bảng đặc tính thời gian 

Hình 3.4(a) và 3.4(b) chỉ là một phiên bản rất đơn giản về các 
ràng buộc thời gian thực. Trên thực tế, có nhiều thời gian tới hạn 
hơn luôn luôn được xác định rõ. Tuy nhiên, đây là một thí dụ tốt về 
cách làm việc của một bus đồng bộ. 
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Ngoài các chu kỳ đọc và ghi, nhiều bus đồng bộ còn hỗ trợ việc 
chuyên các khối dữ liệu. Khi bất đầu đọc một khối, thiết bị chủ phải 
cho thiết bị phụ thuộc biết cần chuyển bao nhiêu byte dữ liệu bằng 
cách đưa sô đếm byte lên các đường dữ liệu trong thời gian của chu 
kỳ T|. Thay vì chi chuyến đúng 1 byte, thiết bị phụ thuộc xuất từng 
byte trong thời gian cua mỗi chu kỳ xung clock cho tới khi sô" đếm 
byte giám hết. Trong thí dụ này, việc đọc một khôi n byte chiếm { 
n + 2 ) chu kỳ xung clock thay vì 3ỉỉ chu kỳ. 

Một phương pháp khác đế gia tăng tốc độ bus là thu ngắn thời 
gian của một chu kỳ. Trong thí dụ trên, để chuyến một byte phải 
mất 750 nsec với băng thông tối da là 1.33 Mbyte/sec. Với xung 
clock có tần sô" 8 MHz, thời gian một chu kỳ giảm một nửa và chúng 
ta nhận được 2.67 Mbyte/sec. Tuy nhiên, việc thu ngắn chu kỳ xung 
clock có thề dẫn đến một sô" vấn đề kỹ thuật. Các tín hiệu trên các 
dường khác nhau không phái tất cả đều có cùng tô"c độ, ảnh hưởng 
này gọi là lệch bus ( bus skew ). Điều quan trọng là thời gian của 
một chu kỹ phái dài so với thời gian lệch bus để ngăn cản ý tưởng 
về các khoảng thời gian được số hóa khỏi sự phá vỡ trong đồng bộ 
tín hiệu tương tự. 

Vấn đề cuô'i cùng là các tín hiệu điều khiển sẽ được xác lập ở 
mức cao hay mức thấp. Vấn đề này sẽ được người thiết kế bus quyết 
định sao cho thuận tiện, sự lựa chọn chú yếu là ngẫu nhiên. Người 
ta có thế xem vấn đề này như phần cứng tương dương với sự chọn 
lựa cúa người lập trình biểu diễn các khôi trống của đĩa trong một 
bản đồ bit bằng các bit 0 hay các bit 1. 

3.1.4 Bus không đổng bộ 

Mặc dù làm việc với các bus đồng bộ sẽ dề hơn do các khoảng 
thời gian rời rạc cúa chúng, nhưng cũng có một số vấn đề xảy ra. Do 
mọi công việc đều được thực hiện trong những khoảng thời gian là 
bội số của chu kỳ xung clock, nếu một CPU cá biệt và bộ nhớ có khả 
năng hoàn tất việc chuyển dữ liệu trong 3.1 chu kỳ, chúng vần phải 
kéo dài tới 4 chu kỳ bởi vì iihừng chu kỳ bị phân đoạn nhỏ không 
được phép dùng trong bus đồng bộ. 
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Tệ hơn nữa, một khi chu kỳ xung clock được chọn, bộ nhớ và 
thiết bị I/O đã được thiết kê cho chu kỳ bus này, thật khó có thể 
nâng cấp trong tương lãi. Giả sử một vài năm sau khi hệ thống 
trong hình 3.4 được thiết kế, các CPU và bộ nhớ mới hoạt động với 
thời gian một chu kỳ là 100 nsec thay vì 250 nsec, hệ thống cũ mặc 
dù vẫn chạy được với hệ thông mới nhưng không thế tăng tốc độ lên 
được vì nghi thức bus yêu cầu bộ nhớ xác lập các đường dữ liệu ngay 
trước cạnh xuống cũa chu kỳ T3. 

Đặt sự kiện này vào nhừxig trường hợp khác, nếu bus có một tập 
hợp không đồng nhất các thiết bị, một sô có tốc độ nhanh và một sô 
có tỏc độ chậm, bus phải thích ứng với thiết bị có tòc độ chậm nhát 
và do dó các thiết bị có tốc độ nhanh không thế dược sứ dụng hét 
khả năng của chúng. 

Kỹ thuật pha trộn này có thể giải quyết bằng cách dùng bus 
không đồng bộ, bus không có xung clock chủ, trình bày trong hình 
3.5. Thay vì ràng buộc mọi thứ với xung clock, khi thiết bị chủ đà 
xác lập các đường địa chỉ, tín hiệu MREQ, tín hiệu RD và các tín 
hiệu cần thiết khác, thiết bị chú sè xác lập một tín hiệu đặc biệt gọi 
là tín hiệu đồng bộ chủ MSYN ( master synchronization). Khi thấy 
tín hiệu này, thiết bị thụ động sè thực hiện công việc bằng chính 
tốc độ của mình. Khi thực hiện xong, thiêt bị phụ thuộc sẽ xác lập 
đường tín hiệu đồng bộ phụ thuộc SSYN ( slave synchronization ). 

Ngay khi thiết bị chủ bus thấy tín hiệu SSYN được xác lập, thiết 
bị này biết rằng dữ liệu dã sử dụng được, vì thế sẽ ch ốt dữ liệu lại, 
sau đó không xác lập các đường địa chỉ cùng với MREQ, RDvà 
MSYN. Khi thấy tín hiệu MSỸN không còn xác lập, thiết bị phụ 
thuộc biết chu kỳ đã hoàn tất, sẽ không xác lập SSYN và chúng ta 
trở lại trạng thái ban đầu, với tất cả các tín hiệu không còn xác lập, 
đợi thiết bị chủ kê tiêp. 

Giản đồ thời gian cúa các bus không đồng bộ sử dụng các mũi 
tên để chỉ nguyên nhân và kết quả, như trong hình 3.5. Xác lập tín 
hiệu MSYN làm cho các đường dữ liệu được xá c lập , và cũng làm 
cho thiết bị phụ thuộc xác lập SSYN. Xác lập SSYN làm cho các 
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đường địa chỉ, MREQ, RD và MSYN không còn xác lập. Cuối cùng, 

MSYN không còn xác lập sẽ làm SSYN không xác lập, kết thúc thao 
tác đọc dữ liệu. 


ADDRESS 




DATA 


SSYN 


MREQ 

RD 


MSYN 


Hình 3.5 Hoạt động của một bus không đồng bộ 

Tập các tín hiệu phối hợp với nhau theo cách này gọi là bắt tay 
hoàn toàn ( full handshake ). Phần cơ bản bao gồm 4 sự kiện sau : 

1. MSYN được xác lập. 

2. SSYN được xác lập để đáp ứng theo MSYN. 

3. MSYN không xác lập để đáp ứng theo SSYN. 

4. SSYN không xác lập để đáp ứng theo sự không xác lập của 
MSYN. 

^ Rõ ràng phương pháp bắt tay hoàn toàn có thời gian độc lập. 
Mỗi sự kiện được gây ra bởi một sự kiện trước, không phải bởi xung 
clock. Nếu một cặp thiết bị chủ-phụ thuộc cá biệt có tốc độ chậm, 
chúng vẫn không làm ảnh hưởng đến cặp thiết bị có tốc độ nhanh 
hơn nhiều. 

Thuận lợi của loại bus không đồng bộ đến đây đã rõ, nhưng 
trên thực tế hầu hết các bus là bus đồng bộ. Nguyên nhân là do hệ 
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thống đồng bộ dễ lắp dặt hơn. CPU chỉ phải xác lập các tín hiệu và 
bộ nhớ chỉ phải tương tác lại. Không có sự hồi tiếp ( nguyên nhân 
và hậu quả ) và nêu các thành phần được chọn hoàn toàn thích hợp, 
các thiết bị làm việc sẽ không cần bắt tay. 

3.1.5 Phân xử bus 

Cho tới lúc này, chúng ta đã ngầm giả thiết chỉ có một thiết bị 
chủ là CPU. Thực ra, các chip I/O cũng có thể trở thành các thiết bị 
chủ khi đọc và ghi bộ nhớ, và chúng cũng gây ra các ngắt. Các bộ 
đồng xử lý cũng trở thành thiết bị chủ khi cần đến các toán hạng. 
Một câu hỏi được đặt ra : “ Điều gì sẽ xảy ra nếu có 2 hoặc nhiều 
thiết bị cùng lúc muôn trở thành thiết bị chủ ? ”. Câu trả lời là cần 
có một số cơ chế phân xử bus nào đó để ngăn cản sự tranh chấp. 

Các cơ chế phân xử bus có thể là tập trung hoặc không tập 
trung. Trước tiên, chúng ta hãy xét cơ chế phân xử bus tập trung. 
Một dạng đơn giản cá biệt của phân xử bus tập trung được trình bày 
trong hình 3.6(a). Trong sơ đồ này, bộ phân xử bus đơn sẽ quyết 
định thiết bị nào kế tiếp là thiết bị chủ. Nhiều bộ vi xử lý thiết kế 
sẵn bộ phân xừ bus ngay trong chip CPU, nhưng trong các hệ thống 
máy tính mini đôi khi là một thiết bị riêng. Bus chứa một đường 
yêu cầu thiết kê theo kiểu OR nối dây được xác lập bởi một hoặc 
nhiều thiết bị vào bất cứ lúc nào. Với cách kết nối này, không có 
cách nào bộ phân xử bus biết dược có bao nhiêu thiết bị đang yêu 
cầu bus, bộ phân xử bus chỉ biết có hay không có yêu cầu sử dụng 
bus. 

Khi thấy có yêu cầu bus, bộ phân xử bus phát tín hiệu cho phép 
dùng bus bằng cách xác lập đường cấp bus ( bus grant line ). Đường 
này được nối qua tất cả các thiết bị I/O theo kiểu nối tiếp giống 
như chuỗi các bóng đèn trên cây giáng sinh. Khi thấy tín hiệu cấp 
bus, thiết bị đứng gần bộ phân xử bus nhất sẽ kiểm tra xem có 
phải đã đưa ra một yêu cầu bus hay không. Nếu đúng, thiết bị này 
sẽ tiếp quản bus và không truyền tin hiệu cấp bus xuống cho các 
thiết bị khác. Nếu không yêu cầu bus, thiết bị này truyền tín hiệu 
cấp bus tới thiết bị kế tiếp trên đường dây và cứ như vậy cho đến 
khi có một thiết bị nào đó nhận tín hiệu cấp bus và tiếp quản bus. 
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Sơ đồ này được gọi là sự ràng buộc chuỗi ( daisy chaining ). Sơ đồ 
này có đặc tính là các thiết bị được cáp quyền ưu tiên tùy thuộc vào 
các thiết bị đó đứng gần bao nhiêu đối với bộ phân xứ bus. Thiết bị 
nào đứng gần nhất sẽ có ưu tiên cao nhất. 

Để đến gần những ưu tiên ngầm định dựa trên khoảng cách từ 
bộ phân xử tới thiết bị, nhiều bus có nhiều mức ưu tiên. Mỗi mức ưu 
tiên có một đường yêu cầu bus và một đường cấp bus. Bộ phân xử 
bus trong hình 3.6(b) có 2 mức ưu tiên, 1 và 2 ( các bus trên thực tế 
thường có 4, 8 hoặc 16 mức ). 

Mỗi thiẽt bị được nôi đến một trong các mức yêu cầu bus. Nhừng 
thiêt bị càng có yêu cầu cấp bách về thời gian sẽ được nôi đến các 
mức ưu tiên càng cao. Trong hình 3.6(b) các thiết bị 1 và 2 sử dụng 
ưu tiên 1 còn các thiết bị 3, 4 và 5 sứ dụng ưu tiên 2. 


Bus request 



1/0 devices 


(a) 



(b) 


r * * \ 

. 


Hình 3.6 (a) Bộ phân xử bus tập trung 1 mức ưu tiên dùng sơ đồ 
ràng buộc vòng (b) Bộ phân xử bus có 2 mức ưu tiên. 
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Chương 3: Câp logic sô 

Arbiter : bộ phán xứ 
Bus request : đường tín hiệu yêu cầu bus 
Bus grant : đường tín hiệu cấp bus 
Bus grant may or may not be propagateđ along the Chain : tín hiệu cấp bus 
truyền hoặc không truyền theo chuỗi 
I/O devices : các thiết bị ngoại vi 
Bus request level 1: đường yêu câu bus mức 1 
Bus grant level 1: dường cáp bus mức 1 

Nêu có nhiều mức ưu tiên được yêu cầu đồng thời, bộ phân xứ 
bus chi phát tín hiệu cấp bus trên mức ưu tiên cao nhất. Trong số 
các thiêt bị có cùng mức ưu tiên, người ta áp dụng sơ đồ ràng buộc 
chuỗi. 

Trong hình 3.6(b), trường hợp có xung đột, thiết bị 3 có ưu tiên 
cao nhất rồi đến các thiết bị 4, 5 và 1. Thiết bị 2 có ưu tiên thấp 
nhất vì ở vị trí ưu tiên thấp nhất trong sơ dồ ràng buộc chuỗi. 

Về mặt kỹ thuật, không cần thiết phải nối đường cảp bus mức 2 
qua các thiết bị 1 và 2 vì chúng không thê tạo ra các yêu cầu bus 
trên đường yêu cầu bus mức 2, nhưng do sự thuận tiện khi hiện 
thực, việc nối tất cả các đường cấp bus qua tất cả các thiết bị sè dễ 
dàng hơn là tạo ra những kết nối dặc biệt tùy thuộc vào mức ưu tiên 
của từng thiết bị. 

Nhiều bộ phản xứ bus có thêm đường tín hiệu thứ 3 đè một thiết 
bị xác lập đường này khi nhận cấp bus và chiếm giử bus. Ngay khi 
đường tín hiệu trả lời này ( acknoNvlegement line ) được xác lập, các 
đường yèu cầu bus và cấp bus sè đối thành không xác lập. Kèt quá 
là các thiết bị khác có thê yẻu cẩu bus trong lúc thiêt bị dầu tiên 
đang sử dụng bus. Vào lúc thao tác chuyền dữ liệu hiện tại hoàn tất, 
thiết bị chủ kế tiếp đã được chọn, có thể bắt đầu ngay khi đường trả 
lời đổi sang trạng thái thụ động. Tại thời diêm này, vòng tiêp theo 
sau của phân xứ bus có thể bắt đầu. Sơ đồ này đòi hỏi thêm một 
đường bus nừa và nhiều mạch logic cho từng thiết bị, nhưng việc sứ 
dụng các chu kỳ bus trở nên tôt hơn. Các chip PDP-11, Motorola và 
một sô chip khác nữa sứ dụng hệ thông này. 
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Trong nhiều hệ thông, CPU cũng phải dành quyền sử dụng bus 
và có ưu tiên thâp nhất, chỉ dành được bus khi không có thiêt bị 
nào khác chiếm bus. Ý tưởng ở đây là CPU có thể lúc nào cũng phải 
đợi, còn các thiết bị I/O thường xuyên phải dành bus nhanh vì nếu 
không dữ liệu đến sẽ mất. Các đĩa quay ở tốc độ cao nên không thể 
đợi. 

Khi sử dụng phương pháp phân xử bus không tập trung, ta 
không cần có bộ phân xử bus. Thí dụ VAX SBI có 16 đường yêu cầu 
bus có ưu tiên, một đường cho mỗi thiết bị. Thiết kế này sẽ giới hạn 
sô thiết bị là 16. Khi một thiết bị muốn dùng bus, thiết bị này xác 
lập đường yêu cầu. Tất cả các thiết bị đều kiểm tra tất cả các đường 
yêu cầu bus, do vậy vào cuôu mồi chu kỳ, thiết bị nào cũng đều biết 
có phải là thiết bị có ưu tiên cao nhất hay không, và do đó có được 
phép dùng bus trong chu kỳ kẽ tiếp hay không. So với phương pháp 
phân xử bus tập trung, phương pháp này đòi hỏi nhiều đường bus 
hơn, nhưng giảm được giá thành do không có bộ phân xử bus. 

Một kiểu phân xử bus không tập trung khác được dùng trong hệ 
thông Multibus. Sơ đồ trình bày trong hình 3.7 chỉ sử dụng 3 đường 
và vấn đề có bao nhiêu thiẽt bị hiện diện không quan trọng. Đường 
bus đầu tiên là đường yêu cầu bus kết nôi theo kiểu OR nôi dây. 
Đường bus thứ 2 gọi là BƯSY được xác lập bởi thiết bị chủ hiện tại. 
Đường thứ 3 được dùng đề phân xử bus. Tất cả thiết bị được nối 
theo sơ đồ ràng buộc chuỗi. Đầu cúa chuỗi này được giữ ở trạng thái 
xác lập bằng cách nối với đường cấp điện 5 volt. 



Hình 3.7 Phân xử bus không tập trung của Multibus. 
































137 
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Bus request : đường yêu cầu bus 
Busy : đường báo bận 
Arbitration line : đường phân xử 

Khi không có thiêt bị nào yêu cầu bus, đường phân xử bus dã xác 
lập được truyền tới tất cả thiết bị. Để chiếm bus, trước tiên thiết bị 
kiểm tra xem bus có rành hay không và tín hiệu phản xử bus đang 
nhận ở ngõ vào IN có được xác lập không. Nêu tín hiệu ở ngõ vào 
IN không xác lập, thiết bị không thể trở thành thiết bị chủ. Tuy 
nhiên, nếu tín hiệu ở ngõ vào IN được xác lập, ngõ ra OƯT của thiết 
bị sẽ không được xác lập đê yêu cầu mọi thiết bị khác ở phần dưới 
của chuỗi không xác lập IN và OƯT. Khi sự tranh chấp qua đi, chỉ 
có một thiết bị có ngõ vào IN xác lập và ngõ ra OƯT không xác lập. 
Thiết bị này trớ thành thiết bị chú, xác lập đường BƯSY và ngõ ra 
OƯT, bắt dầu truyền dữ liệu. 

Một ý tưởng nhỏ về phân xứ bus cho thấy, thiết bị đầu tiên bên 
trái luôn được truy xuâ"t bus liên tục. Vì thế, sơ đồ này tương tự với 
sơ đồ phân xử bus theo kiểu ràng buộc chuồi ban đầu, chỉ khác là 
không có bộ phân xứ bus, vì thế giá thành sẽ ré hơn, nhanh hơn, và 
tránh được ảnh hướng khi bộ phân xứ bus bị hư ở trường hợp phân 
xử bus tập trung. Hệ Multibus cũng đưa ra phương pháp phân xứ bus 
tập trung, vì thế người thiết kế hệ thông có khẩ năng lựa chọn. 

Phương pháp sau cùng về phân xử bus có liên quan đến các thao 
tác đa chu kỳ ( multiple cycle operation ). Trong các hệ thông đa xử 
lý, người ta thường dùng một từ nhớ đế bảo vệ các câu trúc dữ liệu 
dùng chung ( shared data structure ). Nếu từ nhớ này là 0, bộ xử lý 
được phép lập từ lên 1 và sử dụng cấu trúc dữ liệu đó. Nêu từ nhớ 
này đã là 1, bộ xử lý đó phải đợi cho tới khi bộ xử lý hiện đang 
dùng câu trúc dữ liệu kết thúc và lập từ nhớ trớ về 0. 

Chuỗi các sự kiện sau đây trình bày một tình huống xảy ra sai. 

1. Bộ xử lý A đọc từ X và thấy bằng zero ( chu kỳ bus 0 ). 

2. Bộ xử lý B đọc từ X và thấy bằng zero ( chu kỳ bus 1 ). 
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3. Bộ xử lý A ghi 1 vào từ X í chu kỳ bus 2 ). 

4. Bộ xứ lý B ghi 1 vào từ X Cchu kỳ bus 3 ). 

Nếu chuỗi sự kiện này xảy ra, 2 bộ xứ lý sẽ đồng thời nghĩ rằng 
có sự truy xuât loại trừ đôi với cáu trúc dữ liệu dùng chung, kêt quả 
dẫn đến sự rối loạn. Đẽ tránh tình trạng này, nhiều CPU có chi thị 
đọc từ nhớ, nếu là 0 sẽ lập lên 1. Điều rắc rôi là một chỉ thị như vậy 
cần 2 chu kỳ bus, một để đọc và một để ghi. Có một cơ hội nhỏ ( 
nhưng không phải không có ) là bộ xử lý thứ 2 sè lẻn vào giữa chu 
kỳ đọc và chu kỹ ghi, phá vờ tình trạng rắc rôi này. 

Giải pháp cho vấn đề này là thêm một đường tín hiệu phụ vào 
bus, gọi là LOCK, được xác lập khi bắt đầu một chì thị như vậy. Khi 
LOCK xác lập, không có bộ xứ lý nào được phép trờ thành thiêt bị 
chủ cho tới khi LOCK trớ lại trạng thái không xác lập. Nguyên tắc 
này cho phép một CPU có khả năng' thực hiện nhiều chu kỳ bus mà 
không có sự ngàn cán nào. Đối với các bus không có tính chất này, 
thật khó thiết kế một hệ thống đa xử lý làm việc đúng. 

3.1.6 Xử lý ngắt 

Cho tới đây, chúng ta chì mới đề cập đến những chu kỳ bus 
thông thường, với thiết bị chú đọc dừ liệu từ thiết bị thụ động hoặc 
ghi dữ liệu lên thiết bị thụ động. Một công dụng quan trọng khác 
cùa bus là xứ lý các ngắt. Khi CPU yẻu cầu thiết bị I/O thực hiện 
một công việc, CPU thường chờ đợi một ngắt khi công việc được 
thực hiện. Việc báo hiệu ngắt sẽ yêu cầu bus. 

Vì có thế có nhiều thiết bị đồng thời tạo ra ngắt, nên vấn đề 
phán xừ à đây cũng giông như đối với các chu kỳ bus thông thường. 
Giải pháp thường dùng là gán mức ưu tiên cho thiết bị và dùng bộ 
phản xứ tập trung để cấp ưu tiên cho các thiết bị có yêu cầu về thời 
gian tới hạn. Hiện nay có nhiều chip chuẩn điều khiến ngắt đang sử 
dụng rộng rãi. IBM PC, PC AT, PS/2 và các máy tương thích với 
IBM PC sử dụng chip 8259A của Intel, mô tả trong hình 3.8. 
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INTA 

RÕ 

WR 

AO 
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D0-D7 


8259A 

Interrupt 

controller 


i L -±r 
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IRO ■ 
IR1 - 
IR2- 
IR3 ■ 
IR4 
IR5 
IR6 
IR7 
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Clock 




Keyboard 


Disk 




Printer 


Hình 3.8 Sừ dụng bộ điều khiến ngắt 8259A. 

CPU : đơn vị xứ lý trung tâm 

8259A interrupt controller ; bộ điếu khiến ngắt 8259A 

Clock : đồng hồ hệ thông 

Keyboard : bàn phím 

Disk : đĩa 

Printer : máy in 

Có thể nối trực tiẽp 8 chip điều khiên I/O ( của 8 thiêt bị I/O ) 
với 8 ngõ vào yêu cầu ngắt IRx ( interrupt request ) của 8259A. Khi 
có một thiết bị muôn gây ra một ngắt , thiêt bị này xác lập đường 
tín hiệu IRx tương ứng. Khi có 1 hoặc nhiều ngõ vào IRx xác lập, 
8259A sẽ xác lập đường tín hiệu ngắt INT ( interrupt ), đường này 
trực tiếp điều khiển chân yêu cầu ngắt trên CPU. Khi CPU có thê 
xử lý một ngát, CPU gởi 1 xung trớ lại 8259A tren chan tra lơi ngat- 
INTA ( interrupt acknowiege ). Tại thời điểm đó 8259A được kỳ 
vọng để xác định ngõ vào tạo ra yêu cầu ngắt bằng cách xuãt sô cúa 
ngõ vao lên bus dữ liệu Phần cứng của CPU dùng số này tạo chỉ số 
( index ) trong một bảng các con trỏ ( pointer ), gọi là các vector 
ngắt ( interrupt vector ), để tìm địa chỉ của thủ tục ( procedure ) và 
thực thi trình phục vụ ngắt. 

8259A có một số thanh ghi nội, CPU có thê dọc và ghi dữ liệu 
trên chúng bằng cách dung các chu kỳ bus thòng thường và các 
chân điều khiển đọc RD ( read ), điều khiên ghi WR ( vvrite ), chọn 
chip cs ( chip select ) và địa chi AO. Khi phan mem đa xư ly ngat 
và sẵn sàng nhận một ngắt kế tiếp, phần mềm sẽ ghi một mã dậc 
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biệt vào một trong những thanh ghi của 8259A, mã này sẽ gây cho 
8259A không xác lập đường INT, trừ phi đang có một ngắt khác chờ 
giải quyết. Các thanh ghi của 8259A cũng có thể được ghi để đưa 
8259A vào một trong các chê độ hoạt động, lập mặt nạ một tập các 
ngắt và các đặc tính khác. 

Khi có nhiều hơn 8 thiết bị I/O, các 8259A được nối theo kiểu 
Cascade. Trong trường hợp này, khả năng lớn nhất có thể có, tất cả 
8 ngỏ vào IRx của một 8259A được nối với các ngõ ra INT của 8 bộ 
xử lý ngắt 8259A nữa, cho phép kết nối với 64 thiết bị I/O trong 
một hệ thống ngắt 2 tầng ( two-stage ). 8259A có một vài chân để 
quản lý sự nôi tầng này, chúng ta đã bỏ qua để đơn giản vấn đề. 

Trong lúc tập trung nghiên cứu vào đề tài thiết kế bus, phần giải 
thích trên cũng đủ cho chúng ta hiểu những điều cơ bản thiết yếu về 
cách làm việc của bus và cách tương tác giừa bộ vi xử lý với các bus. 
Bây giờ ta hãy xét một số thí dụ về các bộ vi xử lý thực tế và các 
bus của chúng. 

3.2 THÍ DỤ VỀ CÁC CHIP VI xử LÝ 

Trong phần này chúng ta khảo sát chi tiết các bộ vi xử lý thuộc 
họ Intel và Motorola ở cấp phần cứng. Chúng ta cũng sẽ so sánh các 
thành viên khác nhau của mỗi họ để xem các chip đó đã phát triển 
như thế nào theo thời gian, ơ cuối phần này chúng ta sẽ so sánh 
tóm lược 2 chip 80386 và 68030 ( đại diện cho các chip vi xử lý 32 
bit ) cũng như xem xét 2 loại bus thông dụng dùng cho 2 họ vi xử lý 
này, IBM PC bưs và VME bus cùng với các loại bus khác đang sử 
dụng hiện nay trong các IBM PC và tương thích. 

3.2.1 Các chip vi xử lý của Intel 

Trước tiên chúng ta hãy khảo sát các chip CPU rất phổ biến của 
họ Intel, 8088 ( dùng trong IBM PC ), 80286 ( dùng trong IBM PC 
AT và PS/2), 80386, 80486 và Pentium ( dùng trong các máy tính cá 
nhân hàng đầu ). Mặc dù các chip này có một số điểm chung, chúng 
cũng có nhiều đặc tính khác nhau. 
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8088 của Intel 

8088 là bộ vi xử lý loại NMOS đặt trong một vỏ 40 chân. Bên 
trong chip này có một nhóm đường dữ liệu 16-bit, nhưng ở một thời 
điểm chỉ đọc và ghi 8 bit với bộ nhớ ( nghĩa là bus dữ liệu của hệ 
thông chỉ rộng 8 bit ). 8088, với 20 đường địa chí, có thể địa chỉ hóa 
tôi đa 1 megabyte bộ nhớ. Bất cứ khi nào có thể, 8088 dều thực hiện 
tìm-nạp chỉ thị trước, đê khi cần đến chi thị kế tiếp, chi thị này đã 
sẵn sàng dược sử dụng. 

8088 có thể hoạt động ở một trong 2 chê độ : chê độ tôi thiểu 
( minimum mode ) và chế độ tôi đa ( maxirnum mode ). Chế độ tối 
thiểu được dùng trong các hệ thông nhỏ với vài thiết bị ngoại vi, 
thực tế là chế độ chỉ có một bộ xử lý. Thí dụ 8088 sử dụng trong 
một bộ điều khiển máy giặt sẽ hoạt động ớ chế độ tối thiểu. Ý 
nghĩa của các chân trong 2 chế độ có khác nhau, chúng đơn giản 
hơn trong chế độ tối thiểu. Trong các hệ máy tính cá nhân, 8088 
hoạt động ở chế độ tối đa, thực tế là chế độ có nhiều hơn một bộ xử 
lý, vì thế chúng ta sè không bàn thêm về chế độ tối thiểu trong tài 
liệu này. 

Các chân ra ( pinout ) của 8088 ơ chẻ dộ tối đa được trình bày 
trong hình 3.9(a). 20 trong 40 chân giữ địa chỉ bộ nhớ hoặc I/O mà 
8088 sẽ đọc hoặc ghi. Các chân này được gọi là A0-A19. Vì 8088 
truyền dữ liệu 8 bit ở một thời điểm, cần có thêm 8 chân cho bus dữ 
liệu. Tuy nhiên, do muôn giảm sô chân cần thiêt sao cho 8088 đặt 
vừa trong một vỏ 40 chân, các đường dữ liệu D0-D7 được ghép trên 
cùng chân với A0-A7. Ưng với thời gian đầu cùa chu kỳ bus nhừng 
chân này, được gọi là AD0-AD7, là các chân địa chỉ, ớ thời gian sau 
của chư kỳ bus chúng là các chân dữ liệu. Người ta dùng những qui 
luật chính xác để chi phôi việc định thì này, vì thê không bao giờ có 
sự lầm lẫn. 

Các chân từ 35 đến 38 cũng được ghép, là các chân địa chỉ lúc 
bắt đầu mỗi chu kỳ bus và là các chân cho biết thông tin trạng 
thái lúc kết thúc. Tình huống này được thể hiện bởi các ký hiệu 
A16 / S3 đến A19 / S6 ( xem các chân từ 35 đến 38 ), gạch chéo 
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dùng để phân biệt 2 tín hiệu không liên quan nhau nhưng có chung 
một chân. 

Chân 33 được gọi là MN / MX ( minimum / maximum ), nhưng 
không biểu thị 2 tín hiệu MN và MX. Chân này được xác lập ở mức 
cao để đưa CPU vào chế độ tôi thiểu và được xác lập ớ mức thâp để 
đưa CPU vào chê độ tối đa. 2 tên với dâu gạch chéo được dùng ở 
dây chỉ là 2 cách khác nhau đề nói về cùng một sự việc. Tuy việc 
dùng ký hiệu này dề gây lầm lẫn, nhưng đây là cách đặt tên của 
Intel. 

Đê tránh tối đa sự lầm lẫn này, chúng ta sè vẻ các chip với các 
chân ra logic ( logical pinout ) hơn là các chân ra vật lý ( physical 
pinout ) cùa chúng. Trong hình 3.9(b) ta lại thấy 8088, lần này các 
tín hiệu logic được thề hiện, không quan tâm đến các tín hiệu này 
được đặt trên chân nào. Thí dụ, ờ đây chúng ta thể hiện A0-A19 
riêng với D0-D7, bới vì chúng không liên quan nhau về tính logic. 
Thực tế việc đề cập đến một sô chân dùng chung không cần thiết 
cho sự hiểu biết về cách làm việc của chip. Một đường chéo ngắn, 
bèn cạnh có ghi một con sô cho biết có bao nhiêu đường tín hiệu 
trên đó ( thí dụ 20 cho A0-A19 ). Cuối cùng vị trí chúng ta chọn cho 
mỗi tín hiệu trong hình vẻ, không dựa vào chân nào được sử dụng, 
thay vào đó các tín hiệu liên quan với nhau được nhóm lại đề tiện 
cho việc giải thích. 

8088 dùng 6 chán đế diều khiển bus. Các chán trạng thái S0-S2 
( status ) xác định loại chu kỳ bus mà 8088 muốn sử dụng. Bảng liệt 
kê trong hình 3.9(c) trình bày các loại chu kỳ bus. RD cho biết CPU 
đang ở chu kỳ đọc bộ nhớ. RD không nhất thiết phái dùng trong chế 
độ tối đa, do bởi các thông tin giông như vậy có thế xuâ't phát từ các 
tín hiệu S0-S2, nhưng đôi khi lại rất thuận tiện. 

8088 xác lập chân LOCK đế báo cho các thiết bị chủ khác không 
được sử dụng bus. Tín hiệu này cần dùng đế dành độc quyền truy 
xuâ't tới bộ nhớ trong một số lệnh quyết định của CPU yêu cầu 
nhiều chu kỳ bus. Chân tín hiệu này thường dùng chủ yếu trong các 
hệ thống đa xử lý. Không giống 5 tín hiệu điều khiển bus khác, 
READY là một ngồ vào ( input ). Khi 8088 yêu cầu 1 byte từ bộ nhớ, 
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CPU này muốn bộ nhớ xuất dữ liệu ra trong 4 chu kỳ xung cloek. 
Nếu bộ nhớ thòa màn yêu cầu này, bộ nhớ xác lập đường READY 
trong lúc đưa byte dữ liệu yêu cầu lèn bus dữ liệu, và chỉ có vậy. Tuy 
nhiên, nếu bộ nhớ có tốc độ quá chậm, bộ nhớ phái đặt tín hiệu 
READY ớ trạng thái không xác lập trước chu kỳ xung clock thứ 4, và 
giữ ớ trạng thái này cho đến khi byte yèu cầu được đưa lẻn bus, đáy 
là trạng thái đợi. Bằng phương pháp này, có thé dùng 8088 vui cac 
bộ nhớ có tốc độ nhanh hay chậm. 


8088 in 

Maximum mode 



vcc 

AĨ5 
AĨ6/S3 
A17/S4 
AI 8/S5 
A19/S6 


GNDC 



S2 SI SO Buscycletype 


0 

0 

0 

Interrupt acknovviedge 

0 

0 

1 

1/0 port read 

0 

t 

0 

1/0 port vvrite 

0 

1 

1 

Halt 

1 

0 

0 

Code access 

1 

0 


Memory read 

1 

1 . 

0 

Memory write 

1 

1 

1 

Reiease bus 


(a> 


(c) 



Interrupts 

Bus arbitratỉon 
Coprocessor 

Status 

Miscellaneous 


Hình 3.9 (aj Các chân ra vật lý cua 8088 (b) Các chân ra logic cúa 8088 
(c) Các loại chu kỳ bus cùa 8088. Dùng các mũi tẽn để phân biệt các tín 

hiệu là nhập, xuảt hay cả hai. 
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Bus cycle type : Ịoại chu kỳ bus 
Interrupt acknowledge : trả lời ngắt 
I/O port read : đọc cổng I/O 
I/O port write : ghi cổng I/O 
Halt : dừng 

Code access : truy xuất mã ( tìm-nạp chỉ thị ) 

Memory read : đọc bộ nhớ 

Memory write : ghi bộ nhớ 

Release bus : giải phóng bus 

Addressing : các chân địa chỉ hóa bộ nhớ 

Data : các chân dữ liệu 

Bus control : các chân diều khiển bus 

Interrupts : các chân ngắt 

Bus arbitration : các chân phân xử bus 

Coprocessor : các chân báo hiệu vỡi đồng xử lý 

Status : các chân trạng thái 

Miscellaneous : các chân linh tinh 

Các tín hiệu ngắt che được INTR ( maskable interrupt ) và ngắt 
không che được NMI ( non-maskable interrupt ) được dùng để ngắt 
CPU. Sự khác nhau giữa 2 tín hiệu là phần mềm có thể tạm 
thời che.( vô hiệu hóa ) loại ngắt che được, nhưng không thể che loại 
ngắt không che được. Ngắt bị che ( masked interrupt ) không bị 
mất, nhưng phải đợi cho tới khi phần mềm cho phép ngắt trở 
lại. Bình thường đường INTR được các thiết bị I/O sử dụng, trái 
lại đường NMI được dùng dể chỉ ra các lỗi kiểm tra chẵn lẻ của bộ 
nhớ, hoặc một số vấn đề quan trọng khác không thể đợi. 

Hai đường yêu cầu bus và cấp bus RQ/GTx ( request / grant ) được 

dùng để phân xử bus, thí dụ, giữa 8088 và chip đồng xử lý dấu chấm 
động ( íloating point coprocessor ) 8087. Sử dụng 2 đường này bộ 
đồng xử lý có thể yêu cầu 8088 thả nổi tất cả các bus ( nghĩa là 
8088 tự không kết nối với bus về mặt điện ), bộ đồng xử lý trở 
thành thiết bị chủ truy xuất bộ nhớ. 

Bình thường 8088 sẽ cấp bus cho bất kỳ yêu cầu bus nào như vậy 
vào cuối chu kỳ bus hiện tại, trừ khi đường tín hiệu LOCK hiện 
đang được xác lập. Người ta có thể dùng 2 đường này để điều khiển 
2 bộ đồng xử lý. 






Chương 3: Cấp logic sô" 


145 ÈS 


Tín hiệu TEST cho phép 8088 kiểm tra trạng thái của bộ đồng 
xử lý. Sự kiểm tra này cần thiết bởi vì khi gặp một chỉ thị dấu 
chấm động, 8088 sẽ khởi động 8087 ( chip đồng xử lý dấu chấm 
động ). Sau đó 8088 tiếp tục thực hiện các chỉ thị bình thường khác 
X không phải dấu chấm động ) song song với bộ đồng xử lý. Khi 
8088 cần kết quả của phép toán dấu châm động, 8088 có thể kiểm 
tra xem bộ đồng xử lý đã thực hiện chưa, nếu chưa 8088 phải đợi. 

Các tín hiệu S3-S6 và QSx chứa thông tin về trạng thái nội của 
CPU. Người ta cũng không rõ tại sao nhà sản xuất cung cấp những 
tín hiệu này. Trong thực tế, chúng thường không được sử dụng. 

Chúng ta đã bàn về tín hiệu MN / MX, vậy chỉ còn tín hiệu 
RESET. Tín hiệu này dùng đế thiết lập lại trạng thái cho CPU, thí 
dụ, khi người sử dụng ấn nút reset trên bàn điều khiển. Sau khi 
được thiết lập lại, CPU được đặt ở trạng thái ban đầu. 

80286 của Intel 

Bộ vi xử lý kế thừa 8088 là 80286. 80286 có 3 lợi điểm chính 
vượt trội hơn 8088. Thứ nhất, 80286 hoạt động ờ cả chê độ thực và 
chê độ bảo vệ ( protected user mode ) rất thích hợp để chạy nhiều 
chương trình đồng thời. Thứ hai, 80286 có bus dữ liệu 16-bit ( giông 
8086 ), tăng băng thông bộ nhớ lên gâp 2 lần. Thứ ba, bản thân nội 
tại 80286 có tốc độ nhanh hơn và có thể chạy với các xung clock có 
tần sô cao hơn. Với những tính chất như vậy, hệ thông dùng 80286 
có tốc độ nhanh hơn từ 5 đến 10 lần hệ thông dùng 8088. 

. 80286 đạt được hiệu suất cao đáng kể do sự có mặt của 4 đơn vị 

chức năng độc lập bên trong, như trình bày ở dạng dơn giản trong 
hình 3.10 

Đơn vị bus ( bus unit ) thực hiện tất cả các thao tác về bus cho 
CPU, tìm-nạp và lưu giữ các chỉ thị và dữ liệu khi cần thiêt. Khi 
không phải thực hiện công việc nào, đơn vị bus tìm nạp trước 6 
byte của các chỉ thị và đưa chúng đến đơn vị chỉ thị ( instruction 
unit ). 

Đơn vị chỉ thị lấy các byte chưa xử lý đã được tìm nạp bởi đơn 
vị bus, giải mã chúng thành các chỉ thị cho việc thực thi tuần tự. 
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Đơn vị chi thị có thể lưu giữ 3 chỉ thị đã giải mả cùng một lức. Nhờ 
đơn vị chỉ thị, luôn luôn có các chi thị đã được giải má, rât ít khi 
CPU phải đợi lây chi thị kê tiếp, vì thế tốc độ thực thi chì thị được 
gia tăng. 

Đơn vị thi hành ( excution unit ) thực thi các chỉ thị đã giải mã 
từ đơn vị chỉ thị dưa tới. Một số chi thị có chứa địa chỉ bộ nhớ. Các 
dịa chi này được đưa tới đơn vị địa chi ( address unit ) đê được xử lý 
thêm. 

Đơn vị địa chí thực hiện tất cã công việc tính toán địa chi và 
quán lý bộ nhớ áo í Virtual niemory ). 



Hình 3.10 Sơ dồ cấu trúc đơn giản bên trong 80286 
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Address unit : đơn vị địa chi 
Bus unit : dơn vị bus 
Execution unit : đơn vị thi hành 
Instruction unit : đơn vị chỉ thị 
Adder : bộ cộng 
Tables : các báng 

Address bus ìnteríace : giao tiếp bus địa chỉ 
Coprocessor interface : giao tiếp đồng xứ lý 
Bus eontrol : điểu khiến bus 
Data bus interface : giao tiếp bus dừ liệu 
Preíetcher : bộ tìm nạp trước 

6-byte prefetcher queue : hàng dợi 6 byte cùa bộ tìm nạp trước 
Registers : các thanh ghi 
ALU : đơn vị số học logic 
Control : điều khiền 

Decoded instruction queue : hàng đợi chi thị đả giãi mã 
Instruction đecoder : bộ giái mã chi thị 

Bộ nhớ ảo là một kỹ thuật cho phép chương trình sứ dụng 
dung lượng bộ nhớ lớn hơn dung lượng mà máy tính có. Bộ nhớ ảo 
được hiện thực bằng cách trao đổi các phẩn cua chương trình tới và 
từ đĩa một cách tự dộng. Chúng ta sè thảo luận chi tiẽt về vân đề 
này trong chương 6. Đơn vị địa chí đưa các ngõ ra tới đơn vị bus đê 
đọc và ghi bộ nhớ. 


Addressing 

Data 


AO-A23-*42- 
BHE - 

16 

D0-D15 


SO-SI *- 

M/tO -+ - 

Bus control ị CQ D/INTA ^- 

LOCK -- 


READY 



INTR 

NMI 

HOLD 

HLDA 


tnterrupts 


Bus arbitratỉon 




/ Coproccssor 


gygL 

ERROÍ 
RESET MisceHaneous 


<t> +5v 


Hình 3.11 Chân ra logic cũa 80286. 
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Addressing : các chân địa chỉ hóa bộ nhớ 

Data : các chân dừ liệu 

Bus control : các chân điều khiển bus 

Interrupts : các chân ngắt 

Bus arbitration : các chân phân xử bus 

Coprocessor : các chân báo hiệu với đồng xử ]ý 

Miscellaneous : các chân linh tinh 

80286 cần có nhiều hơn 40 tín hiệu, vì vậy Intel bắt buộc phải 
thiết kế một dạng vỏ khác thích hợp hơn. 

Thay vì vỏ có 48 chân và một sô đường tín hiệu tiếp tục được 
ghép lại với nhau như ở 8088, Intel quyết định đặt trong một vỏ 68 
chân hình vuông, mỗi cạnh có 17 chân, vỏ này cho phép có 24 tín 
hiệu địa chỉ, 16 tín hiệu dừ liệu và 16 tín hiệu điều khiển, cộng với 
xung clock, đường cấp nguồn, tiếp đâ't và một số chân bỏ trông 
không kết nôì. Các chân ra logic của 80286 được trình bày trong 
hình 3.11. Không có sự phân biệt về chế độ tối thiểu và chế độ tối 
đa ở 80286, chỉ có 1 chế độ và 1 cấu hình chân ra. 

Chúng ta đã biết công dụng của các tín hiệu địa chỉ và dữ liệu. 
Tuy nhiên, có một tín hiệu mới liên quan đến việc địa chỉ hóa bộ 
nhớ không có trong 8088, tín hiệu cho phép byte cao BHE ( byte 
high enable ). Sự cần thiết của BHE xuất phát từ khả năng đọc ( và 
đặc biệt là ghi ) các từ 16-bit như là một đơn vị nhớ của 80286. Tuy 
nhiên, các chỉ thị cùa CPU còn có thế đọc { và ghi ) 1 byte. Vấn đề 
đọc 1 byte không quá khó, CPU đọc 1 từ dữ liệu 16-bit rồi từ đó lấy 
ra byte cần thiết. Ngược lại vân đề ghi sẽ khó khăn hơn, khi ghi 1 
byte ta không được làm thay đổi nửa còn lại của từ chứa byte đó. 
Tín hiệu BHE không được xác lập để tránh không cho byte cao 
( upper byte ) được truyền đi và như vậy sè không ghi đè vào bộ 
nhớ. Với 24 dường địa chỉ A0-A23, ta có thể địa chỉ hóa một byte 
bất kỳ tro ng kh ông gian địa chỉ, chần hoặc lẻ. Bằng cách không xác 
lập đường BHE, 80286 có thể đọc hoặc ghi chính xác một byte ở bất 
kỳ nơi nào trong bộ nhớ. 

Các chân điều khiển bus của 80286 tuy có hơi khác so với 8088, 
nhưng ý tưởng chung giống nhau. Chúng xác định một chu kỳ bus 
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đang thực hiện là chu kỳ đọc bộ nhớ, ghi bộ nhớ, dọc thiết bị I/O, 
ghi thiêt bị I/O hay là một chu kỳ bus khác. Các quy ước đặt tên cùa 
Intel cho S0,S1, M/IO t memory/IO ) và COD/INTA ( code/ interrupt 
acknowlege ) có phần hơi tùy tiện và không mang nhiều thông tin. 
Trong thực tế, từ 4 tín hiệu này ta có một báng đơn giản với 16 
điếm nhập ( entry ), tương ứng với 16 tổ hợp bit, cho biết mỗi tố 
hợp thực hiện điều gì ( ứng với loại chu kỳ bus nào ). Có 7 tỏ hợp 
thường sứ dụng, 4 tồ hợp không làm gì cả và 5 tổ hợp không sứ 
dụng. Tín hiệu LOCK và READY có chức năng giống như ỡ chip 
8088 { khóa bus và xác lập trạng thái đợi ). 

Tương tự, INTR và NMI cũng có chức năng giống như các chán 
cùng tên của 8088. Chip 8088 và 80286 đều cho phép thiết bị I/O 
tạo ra các ngắt tới CPU, trong đó có ngắt che được và ngát không 
che được. 

HOLD và HLDA ( hold acknovvledge ) là các tín hiệu moi cua 
80286 cung cấp một phương pháp chung cho vấn đề phân xư bus. 
Khi một thiết bị chủ muốn sứ dụng bus, tín hiệu HOLD được xác 
lập. Sau khi thây yêu cầu này, 80286 sè thả nối các chân và xác lập 
đường HLDA, tại thời điểm này thiết bị chủ mới này sè chiếm giữ 
bus. 80286 tiếp tục duy trì ờ trạng thái thả nổi và HLDA vần được 
xác lập. Khi thiết bị chú mới thực hiện xong công việc, HOLD 
không xác lập và 80286 tiếp tục cống việc bình thường. 

Các tín hiệu liên quan đẽn đồng xừ lý của 80286 có nhiều chi 
tiết tỉ mỉ hơn 8088, cho phép các bộ đồng xử lý sử dụng đơn vị quản 
lý bộ nhớ ( memory management unit 1 của 80286. Bằng cách sử 
dụng tín hiệu yêu cầu bộ xử lý mớ rộng PEREQ { processor 
extension request ), bộ đồng xử lý có thề yêu cầu 80286 tìm-nạp nội 
dung cũa một địa chi áo. Khi từ xuất hiện trẽn bus, 80286 xác lập 
tín hiệu trả lời bộ xử lý mở rộng PEACK ( processor extension 
acknowledge ) cho phép bộ đồng xứ lý lấy từ. Toàn bộ cơ chê này 
dược thực hiện bằng phần cứng, không có một ngắt mềm nào cả. 

Các tín hiệu BUSY và ERROR cho phép 80286 nhận biết trạng 
thái của bộ đồng xử lý và đợi bộ xử lý này hoàn tất bất cứ còng 
việc nào đang làm. Sự khác nhau giữa 2 tín hiệu này là : BƯSY 
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được dùng cho các báo hiệu bình thường, trong khi đó ERROR được 
dùng đề ngắt CPU khi có một lỗi nào đó xảy ra, như lỗi tràn sô dâu 
chấm động chẳng hạn. 

Tin hiệu RESET ờ 80286 có công dụng giông như ở 8088, cho 
phép mạch điện bên ngoài thiết lập lại trạng thái ban đầu cho máy 
tính. Các chân tín hiệu CLK, câp nguồn và tiếp đát cũng giỏng như 
ờ 8088, mặc dù ở 80286 chúng hiện diện trên nhiều chân hơn. Cuôì 
cùng, nên lưu ý rằng 80286 còn có một chân nối đất qua 1 tụ điện có 
điện dung 0.0047 microíarad vì những lý do thuộc kỹ thuật tương 
đồng ( analog engineering ). 

80386 của Intel 


ABCDEFGHJKLMNP 



Hình 3.12 Vó bọc 132 chan cua bv>386. 

Chip CPU 32-bit đầu tiên cùa Intel là 80386. Trong phạm vi tốc 
độ tính toán thô, có thể so sánh 80386 với một mainỉrame nhỏ. 
Ngoài vấn đề tốc độ cao, 80386 còn có vài thuận lợi khác vượt trội 
80286. Thứ nhất, tất cả các thanh ghi và các chỉ thị đều có the xử lý 
trên các giá trị 8-bit, 16-bit hoặc 32-bit. Thứ hai, 80386 cung cấp 
cho các chương trình một bộ nhớ ảo lên tới 2 46 byte ( so với 2 32 byte 
à 80286 ) và có thể quản lý đến 4 gigabyte bộ nhớ vật lý ( so với 16 
megabyte ở 80286 ). Cuối cùnsr. 80386 có thể mô phỏng đươc cả 
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8086 và 80286 nèn có khá năng chạy một sô lượng lớn phần mềm 
( kể cả các hệ điều hành ) thiết kế cho các CPU này mà không cần 
có sự thay dối nào. 

80386 có bus địa chí 32-bit, bus dữ liệu 32-bit và các tín hiệu 
điều khiến khác nên một vỏ bọc 68 chán dùng cho 80286 sè quá 
nhó, do đó Intel đã thiết kê một kích thước chuẩn lớn hơn. Vó này 
bao gồm 14 X 14 = 196 lưới vuông các chân ra với 8 X 8 = 64 lưới 
phụ ờ giữa bỏ qua, cho tổng sô chân sữ dụng là 132 chân như trình 
bày trong hình 3.12. Nhiều chân trong sô các chân này là nhân bản 
cùa các chân khác hoặc không dược sứ dụng. 

Bẽn trong 80386, giống như 80286, có một số dơn vị chức nâng 
hoạt động song song nhau để tâng hiệu suảt. Thay vì có 4 đơn vị, 
80386 có 8 đơn vị do bới đơn vị dịa chi và đơn vị thi hành dược chia 
thành nhiều dơn vị nhỏ hoạt động độc lập. Mặc dù thiết kế này 
phức tạp hơn nhưng hiệu suất lại gia tãng đáng kè. 

Các chân ra cùa 80386 cũng tương tự như 80286, dược trình bày 
trong hình 3.13. Bản thân bên trong 80386 làm việc với các từ 32- 
bit và mọi tham khảo bộ nhớ phải dược sắp xếp theo giới hạn là 4 
byte. Do vậy CPU có thê tìm-nạp các từ ớ các địa chi 0, 4, 8 v.v..., 
không phái các từ ớ các địa chĩ 1, 2 hoặc 3. Kêt quả là tât cả địa chi 
bộ nhớ đều là bội cùa 4 nên 2 bit địa chỉ thấp nhát luôn luôn là 0, 
nghĩa là không cần có AO và Al. Tuy nhiên, các chi thị hiện hừu 
chứa các đại lượng 8-bit và 16-bit trong bộ nhớ, vì thê vân đề được 
giải quyết bằng tín hiệu BHE trong 80286 cùng xuất hiện ờ đáy, 
nhưng dở hơn. 

Điều này được giải quyẽt dề dàng bằng cách dùng 4 tín hiệu cho 
phép bus BE0-BE3 { bưs enable ) để chi ra từng byte trong 4 byte 
cùa từ, các byte nào được dùng đèn. 

Theo truyền thống, Intel vẫn duy trì việc xác dinh lại tất cả tín 
hiệu điều khiên bus đỏi với mỗi chip mới. Lần này chúng dược gọi là 
w/ R ( write/reađ ), D/ c ( data/code ) và M/IO ( memory/IO ). Chi 
cần 3 tín hiệu này ta phân biệt được 7 loại chu kỳ bus ( đọc mã, đọc 
dữ liệu, ghi dữ liệu, đọc I/O, ghi I/O, trả lời và dừng ). 
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Addresslng 

Data 


30 

A2-A31 
BẼÕ-BẼ3 

32 

D0-D31 


Bus control < 



21™ Interrupts 

NMI 


*•- HOLp Bus arbitration 

HLDA 


■ _ 

ERROR 


} 


Coprocessor 


RESET Miscellaneous 


*> +5v 


Hình 3.13 Chân ra logic cùa 80386. 

Addressing : các chân địa chi hóa bộ nhớ 

Data : các chân dữ liệu 

Bus control : các chân diều khiên bus 

Interrupts : các chân ngắt 

Bus arbitration : các chân phân xứ bus 

Coprocessor : các chân báo hiệu với đồng xử lý 

Miscellaneous : các chân linh tinh 

Các tín hiệu LOCK và READY không thay đổi nhưng có 3 tín 
hiệu điều khiển bus mới trên 80386. Tín hiệu trạng thái địa chỉ 
ADS ( address status ) chi ra rằng một địa chi có giá trị đang ớ 
trên bus. Bộ nhớ khi thấy tín hiệu này sè biết rằng các đường địa 
chí và điều khiển bus đều có giá trị, do vậy có thể bắt đầu làm việc 
ngay. 

Chân kích thước bus 16 BS16 ( bus size 16 ) là một ngõ vào được 
xác lập dế 80386 biết hệ thống có gắn các chip I/O 16-bit cũ. Khi 
thấy tín hiệu này, 80386 thực hiện việc truyền dừ liệu 32-bit thành 
2 lán truyền dữ liệu 16-bit liên tiếp. 

Trong khi tín hiệu BS16 dùng làm chậm lại tốc độ của hệ 
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tốc độ hệ thống. Bằng cách xác lập NA, bộ nhớ có thể báo cho 
80386 biết đã được chuẩn bị để nhận địa chỉ kê tiếp mặc dù chưa 
xác lập tín hiệu READY cho chu kỳ bus hiện tại. Đặc tính này cho 
phép giải pháp đường ông được tăng cường bằng cách khới động bộ 
nhớ chuẩn bị cho chu kỳ kế tiếp ngay trước khi CPU kết thúc quá 
trình xử lý chu kỳ bus hiện tại. 

Các tín hiệu INTR, NMI, HOLD, HLDA, PEREQ, BUSY, ERROR 
và RESET có trên 80286 cũng có chức năng giống như vậy ở 80386, 
nhưng không có PEACK vì 80386 có thể truy xuất trực tiếp bộ đồng 
xử lý. 

3.2.2 Các chip vỉ xử lý của Motorola 

Phần này sẽ khảo sát các chip 68000, 68020 và 68030 cũa 
Motorola. Không giông 3 chip của Intel vừa nghiên cứu, chúng là 
các CPU hoàn toàn khác, nhưng 3 chip của Motorola lại rất gióng 
nhau. Chip thứ nhâ't, 68000, có cấu trúc 32-bit với bus dừ liệu 16- 
bit. Chip thứ 2, 68020 khác với 68000 ớ chỗ có bus dừ liệu 32-bit, 
thêm một vài chì thị và một sỏ đặc tính nhỏ khác, về cơ bản 68030 
là 68020 cộng thêm một cache ( bộ nhớ truy nhập nhanh ) dữ liệu 
và một đơn vị quản lý bộ nhớ ( memory management unit ) được 
đóng gói trên cùng một chip. Chúng ta sẽ nghiên cứu bộ nhớ truy 
nhập nhanh trong chương 4 và đơn vị quản lý bộ nhớ trong chương 
6 . ' 

Thay vì đi vào chi tiết các chân ra cùa tât cả 3 chip, ta sẽ tập 
trung vào 2 thành viên tiên tiên nhát của họ Motorola là 68020 và 
68030. Một cách khái quát, hầu hêt những gì có trong 68020 và 
68030 cũng có trong 68000. Chỉ có vài điểm khác nhau ( ngoài điểm 
bus địa chỉ và bus dữ liệu có kích thước nhỏ hơn ) liên quan đèn 
những vân đề ít quan trọng hơn như vân đề hỗ trợ cho các chip I/O 
8-bit ( bây giờ đã quá xưa ). 

68020 và 68030 của Motorola 

Các đoạn dưới đây sẽ mô tả các chân ra logic của 68020 và 
68030. Chúng ta sè dùng tên “68030” nhưng các mô tả vần đúng cho 
cả 68020, ngoại trừ điều khiển cache và hỗ trợ mô phỏng không có 
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trên 68020. 68030 có 32 chân địa chỉ, A0-A31, và 32 chân dữ liệu, 
D0-D31, như trình bày trong hình 3.14. Thêm vào đó, kích thước 
cúa toán hạng, 1, 2 hoặc 4 byte được mã hóa trong SIZ0 và SIZ1. 

Các chip của Motorola có cơ chế điều khiển bus tỉ mí hơn các 
chip cứa Intel. Hơn nữa, tât cả tín hiệu điều khiển đều dược xác ỉập 
ớ mức tháp. Lúc bắt đầu mỗi chu kỳ bus, 68030 xác lập tín hiệu bắt 
đầu chu kỹ ngoài ECS ( external cycle start ) để đồng bộ ( timing ) 
chu kỳ với chip bộ nhớ và chip I/O. Việc đọc hoặc ghi một từ phải 
mát nhiều chu kỳ. Tín hiệu bắt dầu chu kỳ toán hạng ocs ( 
operand cycle start ) chí được xác lập trên chu kỳ đầu tiên của các 
chu kỳ này. Loại chu kỳ bus được cho biết bởi FCỎ-FC2, tương tự 
như S0-S2 ớ 8088. Ngoài ra, R/ w cho biết đó là chu kỳ đọc hay 
chu kỳ ghi. Giông như RD ờ 8088, thông tin này có nhiều thuận lợi 
hơn vì nó bắt nguồn từ FC0 - FC2 . Khi tất cả tín hiệu trên đã được 
xuát ra và ổn định trên bus, 68030 xác lập tín hiệu chôt địa chỉ AS 
( address strobe ) đẻ thông báo sự kiện này tới những phần còn lại 
cúa hệ thống. 


Addresslng A0-A31 

Data D0-D31 

Size SIZ0-S!Z1 


32 


Bus control < 



s DSACKO 


DSACK1 

{ IPL 0-IPL2 
I PEND 
AVEC 


32 

2 
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BGACK 


— RESET 

— HACT 

— BERR 

— CDIS 

— STERM 

— CĨÌN 
CIOUT 

■*» CBREQ 

— CBACK 


REFILL 

STATUS 

MMUDIS 


4> +Sv 


ị Bus arbitration 
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► Miscellaneous 
(68030 only) 

} Cache control 
(68030 only) 

} Emulation 
support 

(68030 only) 


Hình 3.14 Chân ra cũa 68020 và 68030. 
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Addressing : các chân địa chỉ hóa bộ nhớ 
Data : các chân dừ liệu 
Size : kích thước 

Bus control : các chân điều khiển bus 

Interrupts : các chân ngắt 

Bus arbitration : các chân phân xử bus 

Cache control ( 68030 only ) : điều khiến cache t chi có ờ 68030 ) 

Emulation support { 68030 only ) : hỗ trợ mỏ phòng ( chi có ỡ 68030 ) 
Miscellaneous ( 68030 only ) : các chân linh tinh ( chí có ỡ 68030 ) 

Trong thời gian của chu kỳ đọc, 68030 xác lập tín hiệu chốt dữ 
liệu DS ( data strobe ) tại thời điếm sẵn sàng nhận dừ liệu. 

Trong chu kỳ ghi, 68030 xác lập DS khi bus dữ liệu có giá trị và 
ồn định. Tín hiệu cho phép bộ đệm dừ liệu DBEN ( data buffer 
enable ) có thẻ được chip bộ nhớ hoặc chip I/O dùng dế cho biết khi 
nào các bộ đệm bus dử liệu ( data bus buffer ) của chúng ( chip bộ 
nhớ hoặc chip I/O ) hoạt động. 

Tín hiệu điều khiển bus cuối cùng là RMC { read-modify«write 
cycle), được sứ dụng theo cách các chip cùa Intel sứ dụng tín hiệu 
LOCK, nghĩa là không cho các thiết bị chủ khác dùng bus trong 
thời gian của một thao tác đa chu kỳ ( multicycle operation ). 
Giống như tín hiệu LOCK, RMC dược dùng dể dồng bộ trong các hệ 
thống da xử lý. 

Hai đường điều khiển bus, DSACKO và DSACK1 ( data and size 
acknovvlegement ) là những ngõ vào đê 11 68030 từ bus. Chúng được 
dùng đế cho biết khi nào việc đọc hoặc ghi hoàn tât, gần tương tự 
như READY trẽn các chip cúa Intel. 

Các đường mức ưu tiên ngắt IPL0-ĨPL2 ( interrupt priority leveỉ 
) được các chip I/O sử dụng đế tạo các ngắt tới CPU. 3 bit nãy đều 
có thế sứ dụng, do vậy có khá nãng tạo ra 7 mức ưu tiên ngắt ( mức 
ưu tiên ngắt 0 không sứ dụng ). Các mức ngắt ưu tiên cao được dùng 
cho các thiết bị đòi hói thời gian tới hạn ( time-critical device ) và 
được ưu tiên cao hơn các mức ngắt ưu tiên thấp trong trường hợp có 
2 hoặc nhiều ngắt đồng thời xáy ra. 
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Khi 68030 chấp nhận một ngắt sẽ trả lời bằng cách xác 
lập đường tín hiệu IPEND ( interrupt pending ). Thông thường thiết 
bị tạo ngắt chí rõ vector ngắt, vector này cho biêt cách tìm thủ tục 
phục vụ ngắt. Tuy nhiên, nêu một thiêt bị không thực hiện được như 
vậy, thiết bị này xác lập ẢVEC ( automatíc vector ) để buộc CPU sử 
dụng các giá trị mặc định nào đó. 

BR, BGvà BGĂCK là những tín hiệu điều khiển cho biêt thiêt bị 
nào sẽ là thiết bị kế tiếp dược quyền sử dụng, bus, gần giống với 
HOLD và HLDA trên 80286 và 80386, nhưng có một điểm khác 
nhau rất lớn. Đường yêu cầu BR ( bus request ) được thiêt bị I/O 
dùng đế yêu cầu bus. Đường cấp bus BG ( bus grant ) được 68030 xác 
lập đế thông báo rằng bus đang được thả nổi. Đến đây, ta thấy thủ 
tục này giống như thủ tục của Intel. Điểm khác nhau là sự hiện diện 
của dường BGACK, đường này được thiết bị yêu cầu bus xác lập sau 
khi thấy tín hiệu câ'p bus BG. 

Về nguyên tắc, một thiết bị có thể yêu cầu và được cấp bus, sau 
đó xác lập BGACK. ơ điểm này, BR và BG có giá trị đối với thiết bị 
khác muốn yêu cầu và được cấp bus trong lúc thiết bị trước vần đang 
dùng bus đế chuyến dữ liệu. Dĩ nhiên, thiết bị thứ 2 sẽ không thực 
sự bắt đầu dùng bus cho tới khi thiết bị thứ nhất cho biết đă hoàn 
tất công việc bằng cách cho tín hiệu BGACK không xác lập. Với việc 
cho phép thiết bị thứ 2 bắt đầu dàn xếp ( thương lượng ) bus trước 
khi thiết bị thứ nhất dùng bus xong, ta tiết kiệm được các chu kỳ. 

RESET và HALT cho phép các thiết bị bén ngoài thiết lập lại 
trạng thái ban đầu và dừng CPU. BERR dùng để báo cáo có một sự 
cô' nào đó, thí dụ 68030 muôn truy xuât tới bộ nhớ không hiện hữu. 
CDIS dùng để vô hiệu hóa tạm thời cache nội ( internal cache ). 
STERM ( synchronous termination ) giống như DSACKO và DSACK1, 
chỉ khác là được dùng trên các chu kỳ bus đồng bộ thay vì trên các 
chu kỳ bus không đồng bộ thông thường. 


Tín hiệu này (STERM) không có mặt trên 68020. 4 tín hiệu điều 
khiển cache cũng không có mặt trên 68020. Cũng không có 3 tín 
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hiệu cho phép 68030 mô phỏng 68020. Hiếu đúng về 3 tín hiệu này 
là điều rất phức tạp và đòi hỏi sự hiểu biết bên trong các chip mà ta 
chưa đề cập đến, vì thế sẽ không đưực mỏ ta ó' dãy. 

3.2.3 So sánh 80386 và 68030 

Các chip 80386 và 68030 đều là các bộ vi xứ lý 32-bit hiệu suất 
cao với công suất tính toán gần như nhau. Vì thế, thật là thú vị khi 
so sánh chúng với nhau để xem các nhà thiết kẽ khác nhau thực 
hiện các quyết định khác nhau ơ cấp phần cứng ra sao. Trong các 
chương tiếp theo, chúng ta cũng xem xét sự khác biệt cúa chúng ở 
các cấp cao hơn. 

Cả 2 chip dều dùng bus địa chi 32-bit, nhưng bus dịa chỉ của 
80386 luôn luôn có 2 bit thấp được lập là 0 nhằm sắp xếp việc 
truyền dữ liệu trên các biên từ nhớ 32-bit { 4 byte ). 68030 không có 
giới hạn này và có thể địa chí hóa bộ nhớ bắt đẩu ở một byte bât 
kỳ. Cả 2 chip đều dùng bus dữ liệu 32-bit. Không có sự khác nhau ở 
đây. Các tín hiệu điều khiến bus hơi khác nhau. 

68030 có các tín hiệu ECS và ocs cho biết bắt đầu một chu kỳ 
bus và một chu kỳ toán hạng, làm cho các thiêt bị bên ngoài dễ 
dàng đồng bộ với CPU. Với 80386, các thiêt bị I/O phải đồng bộ 
bằng cách tự kiểm tra bus. Cá 2 chip đều có các tín hiệu ( ADS và 
AS ) thông báo rằng bus địa chỉ có giá trị, nhưng chỉ 68030 có 
tín hiệu tương tự ( DS ) cho bus dữ liệu. Cả 2 đều dùng một mã chức 
năng 3-bit để xác định loại chu kỳ bus và cả 2 đều có phương pháp 
rõ ràng cho phép bộ nhớ và thiêt bị I/O báo hiệu hoàn tât một chu 
kỳ (RẼADỸ và DSACKx ). Cả 2 đều có một phương pháp khóa bus 
cho những thao tác đa chu kỳ { LOCK và RMC). 

Vân dề diều khiển ngắt cũng hơi khác nhau. 80386 chỉ có 2 ưu 
tiên chính, che được và không che được, trong khi 68030 có 7 mức 
ưu tiên. Về phân xử bus chúng cũng khác nhau, 68030 cho phép 
thiết bị thứ 2 yêu cầu bus trước khi thiết bị thứ nhất sử dụng xong 
bus, điều này không xảy ra ở 80386. 

Mặc dù cả 2 bộ vi xứ lý đều có bộ đồng xứ lý dấu chấm động, 
nhưng phương pháp giao tiếp của chúng hơi khác nhau. 80386 xem 
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bộ đồng xử lý như một thiết bị đặc biệt, và có những tín hiệu riêng 
đề thông tin. Trái lại, 68030 xem bộ đồng xử lý chi như một thiết bị 
I/O và thông tin bằng những chu kỳ bus thông thường. Phương pháp 
này cho phép dễ dàng lắp thêm các bộ đồng xứ lý vào 68030. Thực 
ra. bộ xứ lý 68030 được thiết kế với ý tướng người sử dụng có thể 
xảy dựng những bộ dồng xử lý trên các board riêng cùa họ. 

Cá 2 chip đều có một dơn vị quan lý bộ nhớ phức tạp trên chip, 
nhưng chỉ có 68030 có bộ nhớ cache dừ liệu. Cả 2 đều dùng phương 
pháp đường ông dế nâng cao hiệu suât. 

Tóm lại 2 chip 80386 và 68030 có nhiều điểm giống nhau hơn là 
khác biệt. Cá 2 nhóm thiết kế đều truy cập đến cùng một công 
nghệ, cả 2 cùng có một mục tiêu và cả 2 theo đuổi cùng một giới tiêu 
thụ, vì vậy không có gì ngạc nhiên khi sản phẩm của 2 nhóm thiết 
kế này khá giỏng nhau. 

3.3 CÁC THÍ DỤ VỀ BƯS 

Bus là một chất keo đế nối các hệ thông máy tính với nhau. 
Trong phần này chúng ta sẽ xem xét kỹ 2 bus thông dụng : IBM PC 
bus ( kể cả PC AT bus ) và VME bus. Các bus được sử dụng hiện nay 
trên các máy tính cá nhân cùa IBM và tương thích cũng được đề cập 
đến. 

IBM PC bus là một thí dụ tốt về một bus sứ dụng trên các hệ 
thông máy tính dân dụng giá thành tháp. Bus có 20 đường địa chỉ, 8 
dường dữ liệu và được sứ dụng rộng rãi trong các hệ thống dựa trên 
8088. Hầu hết các máy tính tương thích với PC đều sử dụng bus 
này. IBM PC bus là nền tảng cùa IBM PC AT bus cũng như các bus 
khác. 

VME bus là một thí dụ tôt về một bus sử dụng trọng các hệ 
thống máy tính công nghiệp. Loại bus này hổ trợ 32 dường địa chỉ, 
32 đường dữ liệu và được sử dụng trong một sô' siêu máy tính mini ( 
superminicomputer ) và trong các ứng dụng tự động hóa công 
nghiệp. 
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3.3.1 IBM PC bus 

IBM PC bus đã trở thành bus chuẩn tồn tại trên các hệ thống 
dựa trên 8088 bời vì gần như tất cà các máy tính tương thích với 
PC đều sử dụng bus này để cho phép các board I/O kết nối vào hệ 
thông cúa chúng. Bus có 62 đường liệt kê trong hình 3.15. Trong 
hình này, cột ký hiệu In là các tín hiệu vào từ bus tới board mẹ, và 
cột ký hiệu Out là các tín hiệu được tạo ra trẽn board mẹ và xuất 
lên bus. 

Bus được khắc trên board mẹ, có khoáng 6 dầu nôi ( connector ) 
hay còn gọi là các khe mỡ rộng ( extension Slot ) dặt cách nhau 3/4 
inch đế gắn các card vào. Mồi card có một bảng chán ( tab ) 
trên card đặt vừa vào khe mở rộng. Tab có 31 chân rảnh mạ vàng ờ 
mỗi mặt tạo tiếp xúc tốt về diện với dầu nối. Theo tài liệu, IBM gọi 
bus là kênh I/O ( I/O channel ), nhưng không có ai khác gọi như vậy. 
Chúng ta chỉ đề cập đến vì có 2 trong sô' các tín hiệu cúa bus dùng 
tên này. 

Các máy IBM PC ban đầu ( cùng như những máy tương thích ) 
có một bộ dao động thạch anh tạo xung clock tần sô 14.31818 MHz. 
Tần số này không được chọn tùy ý mà do yêu cầu tạo ra tín hiệu 
burst màu ( colorburst ) sử dụng trong các hệ thông truyền hình 
màu ớ Bắc Mỹ và Nhật. ( Ban đầu IBM nghĩ rằng người tiêu thụ 
muốn dùng những máy thu hình màu làm thiêt bị hiên thị đế tiêt 
kiệm chi phí khi mua một màn hình máy tính ( monitor ). Dù 
không có ai làm như vậy, nhưng vì đã chọn lựa nên IBM vẫn cài tần 
số này vào máy tính ). Tín hiệu 14.31818 MHz hiện diện trên đường 
tín hiệu dao động osc ( oscillator ) cũa bus. 

Tần số của tín hiệu osc quá cao đôi với 8088 ( tần sô hoạt 
dộng tối đa cua 8088 là 5 MHz ) nèn ta phải chia tần sỏ osc cho 3 
dế có tín hiệu 4.77 MHz, thực sự làm việc như một xung clock chủ 
( master clock ) đê quyêt định thời gian của một chu kỳ bus. Việc 
chia tần sỏ cùa bộ dao động thạch anh cho 3 được thực hiện bới 
một chip tạo xung clock 8284A cứa Intel. Tín hiệu tần sò 4.77 MHz 
cũng ở trên bus và được gọi là CLK, có mức thâp trong 2/3 và mức 
cao trong 1/3 chu kỳ tín hiệu, không đối xứng như tín hiệu osc. 
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Một sô máy tương thích với PC chạy ở tần sô" 8 MHz sử dụng phiên 
bán nhanh hơn cứa chip 8088, các máy này có tín hiệu CLK tần sô' 
cao hơn. 


Tín hiệu 

Số 

đường 

In 

Out 

Mó tá 

osc 

1 


X 

Tín hiệu clock 70 nsec { 14.31818 MHz ) 

CLK 

1 


X 

Tín hiệu clock 210 nsec í 4.77 MHz ) 

RESET 

1 


X 

Dùng lập lại trạng thái ban dầu cho CPU 

A0-A19 

20 


X 

20 đường địa chi 

D0-D7 

8 

X 

X 

8 dường dữ liệu 

ALE 

1 


X 

Cho phép chốt dịa chỉ 

MEMR 

1 


X 

Đọc bộ nhớ 

MEMW 

1 


X 

Ghi bộ nhớ 

ĨOR 

1 


X 

Đọc ƯO 

IOW 

1 


X 

Ghi I/O 

AEN 

1 

X 


Cho phép địa chí ( CPU thá nổi bus ) 

IOCHCHK 

1 

X 


Kiểm tra kẽnh I/O ( lỗi chẵn lẻ ) 

10 CH RDY 

1 

X 


Kênh I/O sần sàng { chèn trạng thái chờ ) 

IRQ2-IRQ7 

6 

X 


Các đường yêu cầu ngắt 

DRQ1-DRQ3 

3 

X 


Các đường yéu cầu DMA 

DACKODACK3 

4 


X 

Các dường trá lời DMA 

T/C 

1 


X 

Kết thúc / số đếm ( chí kết thúc DMA ) 

Power 

5 



+- 5 V, +- 12 V 

GND 

3 



Đất 

Reserved 

1 



( không dùng trên PC, chọn card trên XT ) 


Hình 3.15 Các tín hiệu trên IBM PC bus 
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8284A cũng tạo ra tín hiệu RESET trên bus. Để thiết lập lại 
trạng thái ban đầu cho CPU, mạch điện bên ngoài gỡi một tín hiệu 
tới 8284A để xác lập RESET, bắt buộc CPU và các thiết bị ĩ/0 tự 
khởi động lại. IBM PC bus cũng có 20 đường địa chỉ và 8 đường dữ 
liệu để bus được sử dụng với 8088. Tuy nhiên, để nhận biết nhiều 
đường khác của bus, cần phải hiểu không chỉ 8088 mà còn phải biết 
một số chip hỗ trợ cho 8088 và cách sử dụng chúng. 


IBM PC bus 



Hình 3.16 Sơ đồ đơn giản cảa một máy tính tương thích PC điển hình với 

CPU và các chip hỗ trợ 
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8284A clock generator : bộ tạo xung clock 8284A 

14.31818 MHz crystal oscillator : bộ dao động thạch anh 14.31818 MHz 

8259A interrupt controller : bộ điểu khiến ngắt 8259A 

74LS373 latch ( 3x ) : bộ chốt 74LS373 ( 3x J 

74LS245 bus transcGÍver : bộ thu phát 74LS245 

8088 CPU : chip vi xứ lý 8088 

8288 bus controller : bộ điều khiên bus 8288 

8237A DMA controller : bộ điều khiển DMA 8237A 

IBM PC bus : bus cua IBM PC 

Hình 3.16 trình bày một phiên bản đơn giản cùa phần quan 
trọng nhất trên boarđ mẹ của một máy tính tương thích PC điển 
hình dựa trên chip vi xứ lý 8088. Phiên bán này bao gồm 7 chip 
chính, một sỏ chip phụ khác không được trình bày ở đây. Hệ thống 
bộ nhớ cũng không trình bày dù dưới dạng kết nối logic hay kết nối 
vật lý với CPU qua bus. 

Điều chú ý đầu tiên trong hình 3.16 là CPU không trực tiếp điều 
khiến các đường địa chi và dữ liệu . Các đường địa chỉ được chốt bởi 
một nhóm 3 bộ chốt 8-bit ( octal latch ) 74LS373 và chỉ sử dụng 20 
trong 24 bít của chúng. 

Trớ lại hình 3.9(a) ta sẽ thấy nhất thiết phải chôt các đường địa 
chi do một số đường địa chỉ này được ghép chung với các đường dữ 
liệu. Lúc bắt đầu mỗi chu kỹ bus của CPU, 8088 xuất ra các đường 
địa ch'. Các bộ chỏt nhận các tín hiệu này và giừ chúng trên các 
đường dịa chi trong phần còn lại của chu kỳ, mặc dù chúng không 
còn xuất hiện ó' các chân AD0-AD7 của 8088 ngay sau đó. Vậy thì 
các bộ chốt có chức năng che dấu sự ghép chân và cung cấp các 
đường địa chỉ thật sự dã được giải ghép tới phẩn còn lại của hệ 
thống. 

Các đường dừ liệu chi được lấy mầu hoặc dược cung cấp bởi các 
card bộ nhớ và card I/O tại những thời điểm đặc biệt ( nghĩa là 
cạnh lẽn cúa chu kỳ xung clock nào dó ) nên không cần đến các bộ 
chốt, chí cần tín hiệu có mặt đúng vào lúc cần đến là đủ. Tuy nhiên, 
các đường dữ liệu trên bus vần được điều khiển bới một mạch thu 
phát bus ( bus transceiver ) 74LS245. Chân DIR ( di-rection ) sè 
quyết định dữ liệu được đưa tới CPU hay lấy từ CPU. 
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Nguyên nhân thực sự của việc đệm các dường địa chỉ và các 
đường dữ liệu là do CPU thuộc loại MOS chip, không cung câp đủ 
dòng đê điều khiến một bus có nhiều board nối vào. Các chip đệm 
loại TTL được cần đến để cung cấp đú dòng. Hơn nữa, khi các thiết 
bị khác ngoài CPU muốn trở thành thiết bị chủ ( thí dụ với quá 
trình DMA ), CPU phải thả nổi bưs. Phương pháp đơn giản đê tách 
CPU ra khỏi bus là phải có thêm một tín hiệu yêu cáu bus bên ngoài 
gọi là cho phép địa chỉ AEN ( address enahle ), dùng để không xác 
lập các chân cho phép xuât OE ( output enable ) trên các bộ chốt và 
các bộ thu phát, như vậy bus được thả nổi. 

Trở lại bus, tín hiệu kế tiếp trong danh sách của IBM PC bus là 
tín hiệu cho phép chốt địa chỉ ALE ( address ỉatch enable ). Tín hiệu 
này được xác lập khi các đường địa chỉ đang được CPU điều khiển, 
cho phép các vi mạch 74LS373 biết khi nào phái chốt các đường địa 
chỉ lại. Tín hiệu ALE cũng được cung cấp trên bus đê bộ nhớ và các 
chip I/O biết khi nào các đường địa chỉ trở nên có giá trị. Trước khi 
ALE được xác lập trong mỗi chu kỳ, các đường địa chỉ sẽ không có 
giá trị và không được sử dụng. 

4 dường bus kế tiếp là MEMR, MEMW, IOR và IOW được dùng 
đế đọc và ghi bộ nhớ, đọc và ghi các thiết bị I/O. Thực tế, bus cung 
cấp 2 không gian địa chỉ riêng biệt, một cho bộ nhớ và một cho I/O. 
Vì thế, đọc tại địa chỉ 0 ( chẳng hạn ) với tín hiệu MEMR xác lập sẽ 
gây cho bộ nhớ tại vị trí 0 đáp ứng, còn đọc tại dịa chi 0 với IOR 
xác lập sè gây cho chip I/O đã được sắp xếp không gian I/O có địa 
chỉ 0 đáp ứng. Bộ nhớ sẽ không đáp ứng khi IORvà IOW được xác 
lập. 

Tuy nhiên, việc xác định khi nào một trong 4 tín hiệu trên được 
xác lập lại hoàn toàn không dễ dàng. Như ta thây trong hình 3.9(c), 
8088 xác định loại chu kỳ bus ở dạng mã bằng cách dùng các tín 
hiệu S0-S2. Để giải mã thông tin này thành 4 tín hiệu bus riêng rẽ, 
chip điều khiển bus 8288 của Intel được sử dụng. Chip này dùng S0- 
S2 làm các ngõ vào và tạo ra các tín hiệu MEMR, MẼMW, IOR và 
IOW cùng với ALE. Chip này cũng nhận AEN từ bus ( được tạo ra 
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bởi các thiêt bị muôn trở thành thiết bị chủ ) và tạo ra tín hiệu làm 
cho các bộ đệm bus đia chỉ và bus dữ liệu thả nổi bus. 

Tín hiệu kiểm tra kênh I/O ÍOCHCHK ( I/O channel check ) được 
xác lập khi phát hiện một lỗi kiểm tra chẫn lẻ trên bus và tín hiệu 
này kích khởi một ngắt không che được. 

Tín hiệu kênh I/O sẵn sàng IO-CH-RDY ( I/O channel ready ) 
được các bộ nhớ có tốc độ chậm sử dụng để chèn thêm trạng thái 
chờ trong các chu kỳ đọc và ghi. Tín hiệu này được nối với chân 
READY của 8088. 

6 đường tín hiệu kế tiếp, IRQ2-IRQ7 là các ngõ vào từ bus đến 
bộ điều khiển ngắt 8259A, như ta thây trong hình 3.8. Khi có một 
hoặc nhiều thiết bị yêu cầu ngắt, bộ điều khiển sẽ theo dõi chúng, 
phát ra tín hiệu ngắt tới CPU và đưa số của vector ngắt lên các 
đường dữ liệu khi CPU yêu cầu. Bình thường IRQO được chip định 
thì ( timer ) sử dụng và IRQ1 được dùng bới ngắt bàn phím. 

Các tín hiệu còn lại trên bus liên quan tới DMA. Khi CPU yêu 
cầu đĩa đọc một khối dữ liệu, bộ điều khiển đĩa được giả sử phải đợi 
byte đầu tiên đến từ đầu đọc đĩa, sau đó, bộ điều khiển đĩa phát ra 
yêu cầu trở thành thiết bị chủ và ghi byte dữ liệu vào bộ nhớ. Trình 
tự tương tự được yêu cầu cho mọi thiết bị có khả năng thực hiện 
DMA. 

Mạch logic cần thiết đê điều khiển nghi thức bus và thực hiện 
DMA trên thực tế bao gồm việc tăng địa chỉ bộ nhớ và giảm số đếm 
byte sau mỗi lần chuyển byte, có hơi phức tạp. Để tiết kiệm chi phí 
đặt mạch logic này cho từng thiết bị I/O, Intel đã thiết kế chip 
8237A nhằm điều hành công việc này thay cho các chip khác. 

Về cơ bản 8237A là một CPU nhỏ có chương trình cài dặt sẵn. 
Khi 8088 muốn bắt đầu DMA trên một thiết bị nào đó, thí dụ đĩấ 
cứng, 8088 sẽ nạp số của thiết bị, địa chỉ bộ nhớ, số đếm byte, 
hướng truyền và các thông tin khác vào các thanh ghi nội trong 
8237A. Khi chip điều khiển đĩa cứng sẵn sàng đọc hoặc ghi byte đầu 
tiên, chip này xác lập 1 trong các đường DRQx trên bus, các đường 
này là các ngõ vào của 8237A. 
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Khi có tín hiệu DRQx đưa tới, 8237A yêu cầu bus và thiết lập 
bus để sẵn sàng truyền 1 byte. Sau đó 8237A phát tín hiệu' DÁCKx 
tới bộ điều khiển đĩa báo cho biết phải ghi byte dữ liệu ( cho thao 
tác đọc ) hoặc đọc byte dữ liệu ( cho thao tác ghi ). Trong thời gian 
của chu kỳ này, bộ điều khiển đĩa đóng vai trò là một thiết bị chú 
và bộ nhớ đóng vai trò là một thiết bị phụ thuộc. Thiết kế này cần 
một số tối thiểu mạch logic trong chip điều khiển. 

8237A có 4 kênh độc lập và có thể điều khiển 4 thao tác chuyển 
dữ liệu đồng thời. 8237A không có 20 dường địa chỉ, chip này dùng 
một số chốt chuyên dụng đê thiết lập các đường địa chỉ bus < không 
được vẽ trong hình 3.16 ). Ngoài ra chân DRQO không được đưa lén 
bus do phải sừ dụng làm tươi RAM động. 

Tín hiệu T/C được 8237A xác lập khi sỏ đếm byte bằng 0. Tín 
hiệu này cho bộ điều khiển biết rằng thiết bị I/O đã thực hiện xong 
công việc và đây là lúc yêu cầu 8259A tạo ra một ngắt. 

8 tín hiệu bus còn lại là các tín hiệu cấp nguồn và tiếp đất. 2 
đường +5 V, 1 đường -5 V, 1 đường +12 V, 1 đường -12 V và 3 đường 
kia được nối đất. 1 đường được dành riêng để dùng trong tương lai, 
nhưng trên PC XT đường này được dùng để chọn card. 

Mặc dù hình 3.16 là sơ dồ không đầy đủ nhưng rất có giá trị. 
Board mẹ của hầu hết các máy tính cá nhân dùng 8088 chủ yêu sử 
dụng các chip này, cộng thêm các chip khác cho bộ nhớ và một sô 
bộ điều khiển I/O, như bàn phím. Hơn nữa, 80286 và 80386 cũng 
dùng các chip tương tự và sắp xẽp cũng theo sơ đồ trên, vì vậy 
những ý tưởng đã tháo luận trên cùng có thể dùng trong những hệ 
thông khác. 

3.3.2 IBM PC AT bus 

Khi IBM giới thiệu máy PC AT dựa trên 80286, đã có một rắc 
rối lớn xảy ra. Nêu bắt đầu từ bản phác thảo và thiêt kê một bus 
hoàn toàn mới 16-bit, có nhiều khách hàng quen thuộc với IBM PC 
đã lưỡng lự khi muốn mua máy PC AT bởi vì không có board nào 
trong số các board đã sử dụng trước đây có thể dùng được trẽn máy 
mới. Mặt khác, việc cài PC bus cũ với 20 đường địa chi và 8 đường 
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dữ liệu sè không thuận lợi đối với khá năng làm việc cứa 80286 : địa 
chỉ hóa đẽn 16 M bộ nhớ và truyền từ dữ liệu 16-bit. 

Giải pháp được chọn là mớ rộng PC bus. Các card cắm vào PC 
bus có một đường gờ nhô ra với 62 tiếp điểm nhưng không chạy dọc 
hết theo chiều dài của card. Giải pháp của PC AT là đặt thêm một 
gờ thứ 2 nối tiếp cách khoảng với gờ chính, và thiết kê mạch điện 
của AT sao cho làm việc đươc với cá 2 loại card. Trên board mẹ, đầu 
nôi cũ của PC bus được nôì tiếp cách khoáng với đầu nối mới dành 
cho PC AT mà ta hay gọi chung là khe mở rộng 16-bit. Ý tưởng 
chung được minh họa trong hình 3.17. 

Đầu nối thứ 2 trên PC AT có 36 đường, trong đó 31 đường cung 
cấp thêm các đường địa chỉ, các đường dữ liệú, các đường ngắt và 
các kênh DMA, cũng như các đường cấp nguồn và tiếp đất. Phần 
còn lại dành cho việc xử lý những khác nhau giừa việc truyền dữ 
liệu 8-bit và việc truyền dừ liệu 16-bit. Thí dụ, một đường bus được 
điều khiển bởi tín hiệu BHE của 80286 để cho phép hoặc không cho 
phép truyền byte cao ( upper byte ). 

Khi IBM sán xuât loạt máy PS/2 như là máy kê thừa của PC và 
PC/AT, họ quyết định đáy là thời điềm bắt đầu lại. Một phần của 
quyết dinh này mang tính chât kỹ thuật ( PC bus trong thời kỳ này 
thực sự đã quá cũ ), nhưng phần chắc chắn cùa quyết định là do 
mong muôn đưa ra một chướng ngại vật làm cản trở các công ty chế 
tạo máy tính tương thích với PC, các công ty này tiếp quản một 
phần lớn thị trường tiêu thụ. Vì vậy, các máy PS/2 dải trung bình 
và cao hơn được trang bị một bus, MicroChannel, hoàn toàn mới. 

IBM PC bus còn có tên là bus kiến trúc chuẩn công nghiệp ISA ( 
industry Standard árchitecture ) loại 8 bit gọi tắt là ISA 8-bit để 
phân biệt với ISA 16-bit hay IBM PC AT bus. ISA là chuẩn bus cơ 
sở cho các máy tính cá nhân hiện đại và là kiến trúc ban đầu được 
sử dụng trong đại đa số hệ thống PC trên thị trường hiện nay. Lý 
do khiến cho kiến trúc dường như lỗi thời này lại được sử dụng 
trong những hệ thống hiệu suất cao ngày nay là khả năng tin cậy 
cao, giá thành thấp và dễ tương thích. Lỵ do thứ hai là loại bus này 
vẫn con nhanh hơn nhiều thiết bị I/O nối vào bus. 
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Hình 3.17 PC AT bus có 2 thành phần, phần PC nguyên thúy và phán mới 

thém vào. 


Motherboard : boarđ mẹ 

CPU and Other chips : CPU và các chip khác 

PC bus connector : đầu nối PC bus 

New connector for PC AT : đầu nôi mới cho PC AT 

Contact : tiếp điểm 

Edge conneclor : đầu nối có gờ 

3.3.3 Các bus 32 bit 

Với sự ra đời của các chip vi xứ lý 32 bit, bus ISA không còn 
thích hợp, Các chip 80386DX có khá năng truyền dừ liệu 32-bit 
cùng 1 lúc trong khi bus ISA chí đáp ứng tôi da 16-bit. Thay vì mỡ 
rộng bus ISA, IBM đã thiết kế một bus mới gọi là bus kiến trúc vi 
kênh MCA ( micro channel architecture ). MCA hoãn toàn khác với 
ISA và vượt trội hơn về mặt kỹ thuật. Tuy nhiên do 2 hệ thông bus 
hoàn toàn khác nhau nên các card được thiêt kê cho ISA không sứ 
dụng được với bus MCA. Vì lý do này cùng với nhiều lý do khác 
không được nêu ra ớ đây. loại bus ISA mở rộng EISA ( extended 
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ISA ) ra đời đề cạnh tranh với bus MCA. Bus MCA có các đặc điểm 
sau : 

Dễ dàng sử dụng vì không có các chuyền mạch cũng như các 
dây nôi (jumper ) trên board mẹ và trên các card. 

Hỗ trợ bus chủ. Các thiết bị chủ có thề yêu cầu sứ dụng bus 
qua một thiết bị gọi ià diêm điều khiển phân xử trung tâm 
CACP ( Central arbitration control point ). Thiết bị này phân 
xử các tranh chấp bus giữa các thiết bị chú sao cho chúng 
đều được sử dụng bus, nghĩa là không có thiết bị độc quyền. 
Mỗi thiết bị được cung cấp một mả ưu tiên trong đó CPU có 
mã ưu tiên thấp nhất, kế đến là các kênh DMA rồi đến các 
thiết bị I/O. 

Bus EISA ngoải việc hố trợ tương thích với các card ISA, còn 
cung cấp các khe mờ rộng có 32 đường dữ liệu để sử dụng với các 
chip 80386DX hoặc cao hơn, cung câp tốc độ nhanh hơn cho các ổ 
đĩa. 

Bus EISA 32-bit bố sung 55 dường mới nhưng không làm tăng 
kích thước khe mớ rộng của bus ISA 16-bit. Các card ISA 16-bit đều 
cắm được và hoạt động được trên các khe mở rộng của EISA 32-bit 
do khe của EISA 32-bit có 2 dãy dầu nôi, trong đó có một dãy cùng 
loại với khe của ISA 16-bit. 

Các bus đã đề cập ở trên đều có tốc độ tương đô'i chậm. Khi IBM 
PC bus được giới thiệu, bus hoạt động cùng tốc độ với bộ vi xử lý. 
Đên khi tôc độ cúa bộ vi xứ lý tãng lên, tôc độ bus gia tăng chỉ nhờ 
dộ rộng băng thông của bus, nghĩa là bus vẫn duy trì ở tốc độ chậm. 
Vấn đề này gây trở ngại cho những giao diện đồ họa đòi hỏi phải xử 
lý rất nhiều dừ liệu video, tốc độ chậm của bus tạo hiện tượng cổ 
chai ( bottle neck ) cho toàn bộ hệ thống máy tính. 

Giải pháp đưa ra là thành lập các bus cục bộ ( local bus ). Điều 
đáng quan tâm là các bus cục bộ có hình thức kiến trúc giống bus 
ISA 8-bit và 16-bit, bus của bộ vi xử lý là bus chính và các thành 
phần đều chạy ờ tốc độ của bộ vi xử lý. Vào năm 1992, phần mở 
rộng của ISA được gọi là bus cục bộ VESA ( VESA local bus ) bắt 
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đầu xuất hiện trên những hệ thống PC. Đầu tiên, khe bus cục bộ 
được thiêt kê chủ yếu cho các card video nhằm phát huy hiệu suất 
video ở mức ưu tiên hàng đầu. Hiệp hội tiêu chuẩn điện tử - video ( 
video electronics Standard association ) đã phát triển một định 
chuẩn bus cục bộ tiêu chuẩn hóa dược coi là bus cục bộ VESA hay 
gọi tắt là VL-bus. VL-bus có các đặc điểm sau : 

Truy xuât bộ nhớ hệ thống trực tiếp ỡ tốc độ cùa chính bộ vi 
xử lý. 

Truyền dữ liệu song song 32-bit với tóc độ tỏi đa 132 M/sec. 

Ố đĩa cứng và giao tiếp IDE 16-bit đạt tốc dộ trung bình 5 
M/sec trong khi dó với VL-bus có thê đạt tốc độ tối đa 8 
M/sec. 

Tuy vậy VL-bus cũng có các hạn chế sau : 

Được thiết kế cho bộ vi xử lý 80486 nên chỉ hoạt động thích 
hợp nhất với CPU này ( tốc độ bus bằng tốc dộ của CPU ) dù 
rằng có thể hoạt động với 80386 hay Pentium. 

Tcíc độ giới hạn thực tế của VL-bus là 33 MHz dù rằng trên 
lý thuyết có thể đạt 66 MHz. 

Vì những lý do trên, VL-bus nhanh chóng bị bỏ quên khi một 
bus mới gọi là liên nối kết thành phần ngoại vi PCI ( peripheral 
component interconnect ) xuất hiện vào năm 1992 nhằm vượt qua 
những yếu kém của các bus ISA và EISA. Tô"c độ truyền dữ liệu ở 
bus PCI nhanh hơn bất kỳ loại bus nào hiện có. Đạt được điều này 
là do bus PCI có thế hoạt động đồng thời với bus bộ vi xử lý. CPU 
có thể xử lý dữ liệu trong bộ nhớ cache ngoài trong khi bus PCI 
truyền thông tin liên tục giữa các thành phần khác của hệ thống. 
Đây là ưu điểm chính cúa loại bus này. 

3.3.4 VME bus 

Trong lúc IBM PC bus và các bus kế tục sau này được dùng rộng 
rãi trong thế giới máy tính cá nhân, trong nhiều ứng dụng khác, 
người ta cần 1 bus có tầm cỡ hơn. Trong phần này chúng ta sẽ mõ 
tả một loại bus như vậy, VME bus, cũng như trình bày sự khác 
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nhau giữa VME bus và các bus khác cúa máy tính cá nhân. VME t 
versa module eurocard ) bắt nguồn từ Versa bus cùa Motorola trước 
đây, nhưng dùng một board có khuôn dạng cùa Eurocard được chuẩn 
hóa kép ( 160 mm X 200 mm ). 

Vào những năm cuối thập niên 70, sau khi Motorola sản xuất 
chip 68000, cỏng ty này quyết dịnh xây dựng và bán các hệ thống 
máy tính dựa trên 68000. Hệ thống dựa trẽn 68000 dầu tiên 
( Exormacs ) sử dụng một backpỉane bus có tên gọi là Versa bus. 
Thời gian ngắn sau đó Exormacs đầu tién được tung ra thị trường. 
Hoạt động ớ châu Au của Motorola đâ đề nghị việc chấp nhận 
Versabus được sứ dụng khuôn dạng của Eurocard, điều này đã 
nhanh chóng trớ thành chuẩn tồn tại trên thực tế đối với các máy 
tính công nghiệp ó' Cháu Ảu và một sô' nơi khác. Motorola công 
nhận rằng đáy là một ý tướng tôt và dã ký giao kèo với Mostek và 
Signetics/Philips đế hỗ trợ bus mới này và gọi tên là VME bus. Khi 
những công ty khác bắt đầu sản xuất các board cho VME bus, người 
ta quyết định thiết lập một uy ban IEEE nhằm tạo ra một chuẩn 
chính thức ( offĩcial Standard ) IEEE P1014 cho loại bus này. VME 
bus là một trong những bus 32-bit chát lượng cao và được dùng rộng 
rãi nhất, đặc biệt đỏi với những ứng dụng trong công nghiệp. Đả có 
trẽn 2000 loại board sứ dụng được với VME bus được chế tạo bới 
hơn 250 cóng ty. 

Một trong những đặc tính hấp dẫn của VME bus là tồn tại một 
định nghĩa tương đôi hình thức ở dạng một quyển sách gần 300 
trang. Quyến sách này mô tả rất chi tiết và chính xác cách làm việc 
cùa bus, cung cấp một lượng lớn các qui luật mà tát cả các card 
VME phái tuân theo, cũng như nhiều lời khuyên mà bất kỳ nhà 
thiết kế đúng đán nào cũng tuân theo nếu họ muốn bán được card 
đang thiết kế. Quyến sách cũng cho nhiều lời nhận xét, chú thích và 
các thí dụ dể một khách hàng có thê mua VME CPU card từ một 
người bán này, mua một card bộ nhớ từ người bán khác, và mua 
một card I/O từ một người bán thứ ba nào đó, và tất cá chúng sẽ 
làm việc với nhau một cách hài hòa. IBM PC bus gần như không 
được xác định rò, do vậy có trường hợp card A và card B đều có thể 
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làm việc riêng lé với CPU được, nhưng chúng sẽ từ chối làm việc khi 
cả 2 cùng có mặt. 

Các mục tiêu cùa VME bus là tính có khá năng vận hành với 
nhau ( interoperability ), hiệu suất cao và độ tin cậy cao. Tính có 
khả năng vận hành với nhau đạt được nhờ có một chuẩn bus hình 
thức mà các người bán phải triệt để tôn trọng. Hiệu suất cao dạt 
được bằng cách dùng bus không đồng bộ, không cần xung clock hệ 
thống để đồng bộ thiết bị chủ và thiết bị phụ thuộc, cho phép các 
board riêng biệt chạy được ờ bất kỳ tốc độ nào mà công nghệ hiện 
tại cho phép. Trong thực tế, giới hạn hiệu dụng trên ( effective 
upper limit ) cho mỗi chu kỳ bus là 100 nsec hoặc khoáng chừng đó, 
bởi vì nếu nhanh hơn sẽ gảy ra rất nhiều lệch lạc và những vân dề 
khác thuộc kỹ thuật tương tự ( analog engineering ). Với 1 byte dừ 
liệu 4-bit truyền mỗi 100 nsec, băng thông hiệu dụng cua bus là 40 
Mbyte / sec. 

Trái lại, IBM PC bus sứ dụng xung clock có tần số 4.77 MHz cô 
định, 1 chu kỳ xung clock là 210 nsec. Do phải mất 4 chu kỳ xung 
clock đê truyền 1 byte, nên băng thông cực đại theo lý thuyêt là 1.2 
Mbyte / sec. Trong thực tế, điều này không thể đạt được bởi vì việc 
phán xử bus không thể cùng thực hiện song song với việc truyền dữ 
liệu như trên VME bus. 

Cũng cần bàn thêm về bus đồng bộ và bus không dồng bộ, bới vì 
tồn tại nhiều bus khác như Multibus II và Nubus hoạt động đồng bộ 
ở tần số 10 MHz ( thời gian của 1 chu kỳ là 100 nsec ) có thể sánh 
với VME bus. Hãy xét một CPU làm việc với tần số nội bộ là 16, 25 
hoặc 30 MHz và chạy trên một bus dồng bộ 10 MHz. Không phải 
tất cả chu kỳ của CPU đều sử dụng bus, thỉnh thoáng bộ nhớ phải 
được tham khảo. 

Vì xung clock nội tại trong CPU khỏng chạy theo kiểu theo sát 
gót ( lockstep ) với bus, nên CPU phái đợi cho tới khi bắt đầu chu 
kỳ bus kê tiêp trước khi bắt đầu thao tác bộ nhớ. Thời gian trì 
hoãn này nằm trong khoảng từ 0 tới 100 nsec, trung bình là 50 
nsec. Giả thiết một chu kỳ bus là đủ, thời gian truy xuất cần thiết 
được tăng từ 100 tới 150 nsec do tính chất đồng bộ của bus. Các bus 
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không đồng bộ có thê bắt đầu một chu kỳ ở một thời điểm bất kỳ, 
không bị ánh hướng bới vấn đề này. 

VME bus đạt dược độ tin cậy cao về cả thiêt kẽ cơ khí và các 
nghi thức bus ( bus protocol ). Thay vì dùng những card với những 
đầu nôi có gờ ( như trong IBM PC bus ), VME bus dùng những card 
có dầu nối thích hợp bao gồm 3 hàng 32 chân kim loại tròn. Những 
đầu nối này được đi cặp với các đê cắm ( Socket ) 92-chân thích hợp. 
Mặc dù chi phí cao hơn, phương pháp này loại trừ được những kết 
nối xấu, một trong nhừng nguồn gốc chính gây ra các sự cô' trong 
các hệ thông máy tính. Một sự cố quan trọng khác là vấh đề chấn 
dộng đã được giám thiểu bằng cách dùng những hộp chứa card 
chính xác cao và các rãnh hướng dẫn, quản lý đến 21 card. Nhiễu do 
điện cũng được giảm bằng cách dùng các backplane nhiều lớp và các 
board. 

Độ tin cậy còn được tăng thêm bằng cách dùng các đường bus có 
thể sử dụng cho việc kiểm tra tự động và tường thuật trạng thái. 
Hơn nữa, bus còn có các đường dự phòng để tắt ( shutdovvn ) hệ 
thống một cách nhẹ nhàng chỉ trong vài milisec, giữa lúc kiểm tra 
một sự cô nguồn sắp xảy ra và lúc nguồn cung cấp giảm xuống mức 
không thể sử dụng được. 

Backplane khác với board mẹ, không chứa bất kỳ thành phần 
tích cực nào, thay vào đó là một board điều khiển hệ thông riêng 
biệt trong đó có chứa bộ kiểm tra sự cô' nguồn, bộ phân xử bus, bộ 
điều khiển ngắt và các bộ định thì khác dùng cho việc kiểm tra và 
cho các tiện ích khác. Board này có thể thay thế dễ dàng khi cần. 

Thực tế VME bus là thành viên trong một họ có 3 bus, được 
thiết kế để làm việc trong những hệ thông máy tính có phạm vi 
thay đổi rộng, từ những hệ thống phát triển nhỏ cho tới những hệ 
đa xử lý phức tạp. Hình 3.18(a) trình bày một hệ tối thiểu có 3 
VME card, một cho CPU, một cho bộ nhớ và một cho bộ điều khiển 
I/O. 

Hình 3.18(b) trình bày một hệ đa xử lý lớn hơn. Trong hệ thống 
này, mỗi một bộ xử lý có một bộ nhớ cục bộ ( local memory ) được 
kết nối đến bộ xử lý qua VSB bus, cũng là một thành viên trong họ 
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VME. Do tất cả mã chương trình và dữ liệu cục bộ đều đặt vào trong 
các bộ nhớ cục bộ , nên chỉ có những chỉ thị tham khảo bộ nhớ dùng 
chung ( shared global memory ) phải dùng đến VME bus. Với thiết 
kế này, băng thông tống cộng của bus có thê vượt lớn hơn giới hạn 
hiệu dụng 40 Mbyte / sec đã bị áp đặt bởi công nghệ VME. Thí dụ 
một bộ da xử lý có 16 CPU, các CPU đều yêu cầu từ dữ liệu 32-bit 
mồi 200 nsec sẽ cần 1 băng thông bus có tổng là 320 Mbyte / sec. 
Nếu 90% các tham khảo này là tìm-nạp các chì thị, đọc và ghi dữ 
liệu cục bộ { dây là một giả định hợp lý trong hầu hết các ứng dụng 
), một hệ thống gồm 1 VME bus và 16 VSB bus có thể điều khiển 
được tái. 
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CPU 


VMS seriat bus 


Local 

memory 


Local 

memory 


Local 

memory 


VSB bus 


CPU 

CPU 

CPU 

Global 

memory 


(b) 


Hình 3.18 (a) Hệ thông VME đơn gián (b) Bộ đa xứ lý VME 

Local memory : bộ nhớ cục bộ 
Global memory : bộ nhớ chung 
VMS serial bus : bus nôi tiếp VMS 

Ngoài VSB bus, họ VME cũng hỗ trợ một đường truyền thông tin 
bit nôi tiếp ( bit-serial communication path ) gọi là VMS bus. 
Bus này hoạt động độc lập với 2 bus kia, có thể dược dùng trong 
truyền thông tin băng thông thấp và đồng bộ giữa nhiều bộ xử lý, 
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song song với việc truyền dữ liệu trên các bus chính. VME bus hơi 
giông với một mạng cục bộ ( local area network ) hoạt động trên 
một cáp đồng trục đơn. 

Các đường VME bus có thê chia thành 4 nhóm: 

1. Truyền dữ liệu. 

2. Phản xử bus. 

3. Các ngắt có ưu tiên. 

4. Các tiện ích. 

Bây giờ chúng ta sè lần lượt xét từng nhóm một. 

VME bus hỗ trợ việc truyền dữ liệu 8-bit, 16-bit và 32-bit để điều 
hành các hệ thống nhỏ, trung bình và lớn. Bus này cũng hỗ trợ các 
đường địa chỉ 16-bit, 24-bit và 32-bit với cùng lý do trên. Mỗi chu kỳ 
bus xác định độ rộng cần thiết của các đường địa chỉ và dừ liệu, đề 
các cặp thiết bị chủ / thụ động khác nhau có thể thông tin trên cùng 
bus với bất kỳ độ rộng nào có hiệu quả nhất đối với chúng, không 
quan tâm'đến những cặp thiết bị khác đang làm gì. 

Vài loại chu kỳ bus được định nghĩa, mỗi loại hoạt động trên 
nhừng tô hợp 1, 2 hoặc 4 byte khác nhau. Đơn giản nhất là đọc và 
ghi 1, 2 hoặc 4 byte. Dự phòng đặc biệt dược thực hiện đôi với việc 
chuyến dữ liệu không đúng ( thí dụ 4 byte bắt đầu ở một địa chỉ 

lẻ ). 

Ngoài ra, việc chuyển các khối dữ liệu ( dọc và ghi ) cũng được 
hỗ trợ, nhưng không được chuyền nhừng khối dữ liệu dài quá 256 
byte. Nguyên nhân giới hạn chiều dài khối dữ liệu là nhằm đơn giản 
hóa việc thiêt kê card bộ nhớ. Nêu cho phép chuyến tùy ý, việc 
chuyển một khối dừ liệu có thế bắt đầu trên một card và chuyển 
tiếp sang card thứ hai cho đến hết, đòi hói tất cả card bộ nhớ phải 
có khá năng chuyển được một khối dữ liệu vào giữa. Bằng cách có 
mỗi một card bộ nhớ bắt đầu Cf bội sô' của 256 byte, ta sè tránh được 
vấn đề này. 
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Qui định về việc cấm truyền qua các biên dữ liệu 256 byte là một 
trong các qui định thuộc đặc tính cùa bus nhàm giâm tối thiểu sự 
không rõ ràng, điều mà các VME card được kỳ vọng. Người ta dễ 
dàng tường tượng một chuẩn mà không đề cập đến chù đề dẫn đến 
kết quả các board bộ nhớ, những người thiết kê chúng thậm chí 
chưa bao giờ nghĩ đến khả năng các sản phẩm cùa họ phái hoàn tất 
việc truyền một khối dữ liệu của một người khác. 

Loại chu kỳ bus kế tiếp là chu kỳ đcc-thay đổi-ghi ( read- 
modify-write ) không thê chia được, cần để hỗ trợ cho các hệ đa xứ 
lý. Cũng có 1 chu kỳ bus trả lời ngắt. Chúng ta đã thấy cá 2 loại 
chu kỳ bus này trước đây và không thảo luận thêm về chúng ở dây 
nữa. 

Loại chu kỳ bus cuối cùng, chúng ta chưa bao giờ gặp trước đáy, 
chu kỳ chỉ có địa chỉ c address only ). Không có dừ liệu nào được 
truyền trong chu kỳ này. Chu kỳ bus này nhằm mục đích cho phép 
một thiết bị chủ thông báo ý định yêu cầu một địa chì, cho phép bộ 
nhớ chuẩn bị và sau đó có thề đáp ứng ngay lập tức khi có yêu cầu 
thực sự dược tạo rá sau đó. Bằng cách cho các bộ nhớ có tôc độ 
chậm lời cảnh báo trước, các trạng thái chờ thỉnh thoáng có thể 
tránh được. 

Có 4 loại thiết bị có thể tham gia vào việc chuyển dữ liệu, ngoài 
thiết bị chủ và thiết bị phụ thuộc. Một bộ kiểm tra vị trí ( location 
monitor ) có thế kiểm tra bus và gây ra một ngắt cục bộ trên board 
mỗi khi có một địa chỉ trong tầm nào đó xuât hiện. Thí dụ, nêu một 
từ nhớ hoặc một thanh ghi I/O nào đó dang được ghi trong khi 
chúng không được hỗ trợ điều này, một bộ phân tích logic 11 Ô 1 đèn 
bus sẽ ghi lại tảt cả các tham khảo bus và kêt thúc khi dạt được từ 
nhớ dưới sự điều tra. n chu kỹ bus trước đó có thể được hiển thị, cho 
phép người sứ dụng phát hiện ra nơi sự tham khảo sai xáy ra. 

Loại thiết bị thứ 4 tham gia vào việc chuyển dữ liệu là bộ định 
thì bus ( bus timer ), bộ này kiểm tra bus liên tục. Nêu phát hiện 
có một chu kỳ bus dang chiếm quá lảu ( do bới bộ nhớ không hiện 
hừu đã được địa chỉ hóa và không có thiết bị phụ thuộc nào đáp 
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ứng ), bộ định thì bus sẽ phát ra một tín hiệu lỗi đế kết thúc chu kỳ 
bus. Không có tiện ích này, bus khống đồng bộ sè bị treo mãi. 


A0-A31 

TTR 

Address 






AM0-AM5 

IDE 

Address modltler 




LWORD 


AS 


VVRITE 


DS0-DS1 


DO-D31 


DTACK 



Hình 3.19, Một chu kỳ đọc cùa VME bus. Các mũi tên có kèm chữ-M là bên 
trong đối với thiết bị chủ. Các mũi tên có kèm chữ s là bên trong đối với 
thiết bị phụ thuộc. Các mũi tên khác bao hàm cả hai. 

Address : địa chỉ 

Address modiíier : bổ nghĩa địa chỉ 

Hình 3.19 minh họa chu kỳ bus đọc 32-bit của VME bus. Khi bắt 
đầu việc truyền, thiết bị chủ xác lập các đường địa chỉ, A1-A31, các 
đường bổ nghĩa địa chỉ { address modiĩier line ) AM0-AM5 và đường 
từ dài LWORD ( long word ). Các đường địa chỉ xác định địa chỉ, các 
đường bồ nghĩa địa chi xác định loại chu kỳ bus, và đường LWORD 
xác định hoặc truyền 32-bit đầy đú hoặc truyền một phần. 
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Sau khi cả 3 đã ổn định, thiết bị chủ xác lập AS t adrress 
strobe ) cho thiết bị phụ thuộc biết địa chỉ đang có giá trị và có thể 
dược chốt. Kê đên, thiêt bị chủ không xác lập ( đối với thao tác đọc 
> hoặc xác lập ( đối với thao tác ghi ) tín hiệu YVRITE. Trong hình 
vẽ, đường gạch chấm chấm cung cấp cho VVRITE để thể hiện chuỗi 
nguyên nhân và hậu quả ( cause and effect sequence ), nhưng tín 
hiệu không nhất thiết phái thay đổi, tùy thuộc vào cái đã có. Cuối 
cùng thiết bị chù xác lập DS0-DS1 cho biết đã hoàn tất và sẵn sàng 
đọc. Thực tế, việc mã hóaDSO, DSl, LWORD và AI quyết định sự 
chọn lựa các byte đã yêu cầu trong từ đă chọn. Việc mả hóa của 4 
trường ( íìeld ) này có phần tối nghĩa. 

Ngay sau khi thiết bị phụ thuộc thấy DS0-DS1 xác lập, thiết bị 
bắt đầu làm việc và đưa dừ liệu lên các đường D0-D31 ngay khi có 
thể. Sau khi làm như vậy, thiết bị phụ thuộc xác lập DTACK để trả 
lời rằng đà thực hiện xong. Thiết bị chủ thấy DTACK sè đưa hầu 
hết các tín hiệu về trạng thái không xác lập. Cuối cùng thiết bị chủ 
không xác lập DS0-DS1, để bảo thiết bị phụ thuộc không xác lập 
DTACK rồi kết thúc chu kỳ. Bus sẵn sàng thực hiện chu kỳ khác. 

Nhóm đường tín hiệu thứ 2 liên quan đến phân xử bus. Có 3 sơ 
đồ được hỗ trợ : ràng buộc chuỗi đơn mức ( single-level daisy 
chaining ), các ưu tiên cố định ( fixed priority ) và xoay vòng ( 
round robin ). Đôi với tất cả các sơ đồ phân xử bus, thiêt bị chú tạo 
ra một yêu cầu bằng cách xác lập một đường tín hiệu nào đó. Khi 
thiết bị chủ được cáp và chiêm bus, thiẽt bị này xác lập tín hiệu bus 
bận ( bus busy signal ) và không xác lập yêu cẩu bus nữa. Bằng cách 
này có thể chọn thiết bị chủ kê tiêp trong lúc thiêt bị chủ hiện tại 
đang làm việc. Tiện ích này cũng có trong các chip 680x0, vì thê 
người ta cũng không ngạc nhiên khi Motorola đưa tiện ích này vào 
trong bus. Trong các hệ thông hiệu suất cao, điều này cải thiện hiệu 
suất một cách đáng kể. 

Chúng ta đã nghiên cứu các phương pháp phân xử bus theo kiểu 
ràng buộc chuỗi đơn mức và các ưu tiên cố định, vì thê chúng ta 
hãy xét đến phương pháp phân xử bus theo kiểu xoay vòng. Khi 
phương pháp này được dùng, các đường yêu cầu bus có ưu tiên 
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ngang nhau. Mỗi một thiết bị chú được nôi với một trong các đường 
này, vì thế với n thiết bị chủ sê có bình quân là n !4 thiẽt bị chủ cho 
mỗi đường. 

Ờ chu kỳ bus đầu tiên, bộ phân xứ bus cấp ph(Ếp cho đường số 0, 
ở chu kỳ bus kê tiếp cấp phép cho đường sô 1 v.v... . Nêu không có 
thiết bị chủ nào yêu cầu trên đường tín hiệu đã cho, việc này sè 
được bó qua. Nêu có nhiều thiết bị muôn trở thành thiẽt bị chủ 
trên cùng đường tín hiệu, phương pháp ràng buộc chuỗi được áp 
dụng. Xét một VME card có 2 bộ kết nối 96-chân, trong đó có 
khoảng 80 chân không được sử dụng và chi đế cung cấp 4 đường tín 
hiệu yêu cầu, điều này quá thật quá phí. Ngay cá với loại Ưnibus 56 
đường cũ cua PDP 11 cùng dã có tới 5 đường tín hiệu yêu cầu như 
vậy. 

Một đặc tính đáng quan tâm của VME bus là một đường được bộ 
phân xứ bus dùng đẽ yéu cầu một thiết bị chú có ưu tiên thấp đang 
tiến hành chuyển một khối dữ liệu dài phải kết thúc để cho phép 
một thiết bị khác có ưu tiên cao hơn chiếm bus. 

Nhóm đường tín hiệu thứ 3 cũa VME bus có liên quan đến các 
ngắt có ưu tiên ( priority interrupt ). Giông như IBM PC bus, VME 
bus cũng có một S<D đường yêu cầu ngắt ( chính xác là 7 ) và một 
đường cấp ngắt kiêu ràng buộc chuỗi. Trong một hệ thông đơn xử lý 
vấn đề xứ lý ngắt thật dễ dàng, các thiết bị phát tín hiệu để gây ra 
một ngắt, và một loại bộ điều khiển ngắt nào đó ( như 8259A ) chọn 
một thiết bị và xác lập chân ngắt trên CPU. 

Khi một bus có nhiều CPU và nhiều thiết bị, như VME bus 
chang hạn, các đường yêu cầu ngắt có thế được phân cho 2 hay 
nhiều bộ điều khiển ngắt, mỗi bộ điều khiển kiểm tra một số đường 
riêng và có nhiệm vụ ngắt một CPU riêng. Thí dụ, các đường tín 
hiệu từ 1 tới 4 được dùng để ngắt CPU số 1 và đường tín hiệu từ 5 
tới 7 được dùng để ngắt CPU sô' 2. 

Một khi có một ngắt đã yêu cầu và được cấp, CPU liên quan sẽ 
bị ngắt. CPU làm gì kế tiếp là ngoài nghi thức bus. Thí dụ, có thể 
hoạt động như một thiết bị chủ và yêu cầu bộ điều khiển cho số của 
vector ngắt dù không được yêu cầu. Nếu có nhiều ngắt xảy ra đồng 
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thời, các CPU bị ngắt phải tranh nhau để làm chủ bus theo cách 
bình thường. 

Nhóm đường bus cuối cùng được dùng cho những chức năng có 
ích. Một trong những đường này là tín hiệu xung clock tần sô cô 
định 16 MHz lấy từ một boarđ điều khiển hệ thống. Nó không được 
dùng để qui định các chu kỳ xung clock, nhưng có thề dùng để đo 
thời gian. 


Chuyển dữ liệu : 


Tín hiệu 

Sô" đường 

In 

Out 

Mô tã 

AI - A31 

31 


X 

Các đường địa chi, AO = 0 

AMO - AM 5 

6 


X 

Các đường bò nghĩa địa chí xác định 
loại chu kỳ bus 

LWORD 

1 


X 

Từ dài. Xác định từng phần độ rộng 
dữ liệu 

AS 

1 


X 

Chốt dịa chí Được xác lập khi địa 
chí ỏn định 

WRITE 

1 


X 

Được xác lập khi ghi. Không xáx lập 
khi đọc 

DSO - DS1 

2 


X 

Chốt dữ liệu . 

DO - D31 

32 . 

X 

X 

Các đường dừ liệu 

DTACK 

1 

X 


Tin hiệu trả lời dừ liệu 

BERR 

1 

X 


Được xác lập khi phát hiện lỗi bus 


Phân xứ bus : 


Tín hiệu 

Số dường 

In 

Out 

Mô tá 

BRO - BR3 

4 

X 


Các dường yêu cầu bus 

BGOIN - BG3IN 

4 


X 

Chuỏi vòng cấp phát bus ( vào ) 

BGOO - BG30 

4 


X 

Chuòi vòng cấp phát bus ( ra ) 

BBSY 

1 

X 


Bus bận 

BCLR 

1 


.X 

Xác lập bới bộ phân xú bus đẻ lấy lại 
bus 
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Các ngắt : 


Tín hiệu 

Số dường 

In 

Out 

Mô tả 

IRQ1 - IRQ7 

7 

X 

X 

Các đường yẻu cáu ngắt 

IACK 

1 


X 

Đầu cùa chuỗi trà lời ngát 

IACKIN 

1 


X 

Chuỗi vòng trả lời ngát í vào ) 

IACKQUT 

1 


X 

Chuỗi vòng trá lời ngắt ( ra ) 


Các công dụng khác : 


Tín hiệu 

Số đường 

In 

Out 

Mô tá 

SYSCLK 

1 


X 

Xung clock hệ thống 16 MHz 

SERCLK 

1 


X 

Xung clock VMS bus 32 MHz 

SERDAT 

1 

X 

X 

Đường dữ liệu cúa bus VMS 

ACFAIL 

1 


X 

Phát hiện mất nguồn AC 

SYSFAIL 

1 

X 

X 

Đường chấn đoán 

SYSRESET 

1 

X 


Reset hệ thống 

Power 

9 



± 5 volt, ±12 volt 

GND 

12 



Tiếp đất 

Dự trử 

1 



Không dùng 


Hình 3.20 Các tín hiệu trên VME bus. 

Hai đường khác dược dùng đề hiện thực VMS bus nối tiếp. Một 
đường cung cáp xung clock tán số 32 MHz đề đầu phát biết khi nào 
phải đặt các bit trẽn đầu phát khác. Như vậy VME bus nối tiếp có 
thể chạy ờ tốc độ 32 Mbps, nhưng cũng có thề chạy ờ nhừng tốc độ 
ước số như 16 Mbps hoặc 8 Mbps. Hai xung clock vừa mô tả không 
nhất thiết phải đồng bộ với nhau và chúng chắc chắn không đồng 
bộ với bất kỳ tín hiệu nào khác trên bus. 

Các đường còn lại có liên quan đến việc khới động, lập lại trạng 
thái ban đầu và kiểm tra hệ thông. Danh sách đầy đủ tất cả các 
đường tín hiệu của VME bus được trình bày trong hình 3.20. Trong 
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hình vẽ, In và Out là đôi với thiết bị chủ hoặc bộ điều khiển hệ 
thống. 

3.4 GIAO TIẾP 

Một hệ thống máy tính có kích thước nhỏ đến trung bình tiêu 
biểu bao gồm 1 chip vi xử lý, các chip nhớ và một số bộ điều khiển 
I/O, tất cả đều được nôi qua một bus. Ta đả nghiên cứu chi tiết về 
các bộ nhớ, các bộ vi xử lý và các bus. Phần này sẽ xem xét phần 
cuối cùng, các chip I/O. Qua những chip này máy tính truyền thông 
với thế giới bên ngoài. 


3.4.1 Các chip I/O 

Có nhiều chip I/O đã được sử dụng và cùng có nhiều chip mới 
sản xuất đang được giới thiệu. Các chip thông dụng bao gồm các 
ƯART, USART, các bộ điều khiển CRT, các bộ điều khiển đĩa và các 
PIO. UART ( universal asynchronous receiver transmitter ) là một 
chip có thể đọc một byte từ bus dừ liệu và ở từng thời điểm xuât 
từng bit nối tiếp nhau tới thiêt bị đầu cuối trên đường truyền nối 
tiếp, hoặc nhập dữ liệu từ thiết bị đầu cuối. Tốc độ cho phép của các 
ƯART thường từ 50 bps tới 19.2 Kbps, độ rộng ký tự từ 5 tới 8 bit; 
có 1, 1.5 hoặc 2 bit stop, có thể dùng hoặc không dùng bit kiểm tra 
chẵn lẻ, tất cả đều dưới sự điều khiển của chương trình. USART 
( universal synchronous asynchronous receiver trasmitter ) có thể 
điều khiển truyền đồng bộ bằng cách dùng nhiều nghi thức khác 
nhau và cũng thực hiện tất cả chức năng của một ƯART. Vì 
chúng ta đã xét ƯART ở chương 2, nên phần này chỉ nghiên cứu về 
giao tiếp song song ( parallel interfaee ) như một thí dụ cho một 
chip I/O. 

Chip PIO 

Chip xuất / nhập song song PIO ( parallel input / output ) tiêu 
biểu là chip 8255A của Intel, được trình bày trong hình 3.21. 8255A 
có 24 đường I/O để giao tiếp với bất kỳ thiết bị nào tương thích với 
TTL, thí dụ như bàn phím, chuyển mạch, đèn hoặc máy in. Chương 
trình của CPU có thể ghi 0 hoặc 1 lên một dường bất kỳ hoặc đọc 
trạng thái nhập của một đường bất kỳ, cung cấp sự linh hoạt nhất 
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trong giao tiếp với ngoại vi. Một hệ thông nhỏ dựa trẽn bộ vi xử lý 
sử dụng một PIO thường có thê thay thê hoàn toàn một board gồm 
nhiều chip SSI và MSI. 


cs 

A0-A1 

WR 

RÕ 

RESET 

D0-D7 


* 




- 8. ^ 



8255A 

Parallel 

1/0 

chip 

^ 8, 




Port A 


Port B 


Portc 


Hình 3.21 Chip PIO 8255A 

8255A parallel ĩ/0 chip : chip xuất / nhập song song 8255A 

Mặc dù CPU có thê định cấu hình cho 8255A theo nhiều cách 
bằng việc nạp các thanh ghi trạng thái bên trong chip, chúng ta sẽ 
tập trung trên một số chế độ hoạt động đơn giản. Cách dơn giản 
nhất là sử dụng 8255A như 3 cổng 8-bit ( 8-bit port ) độc lập : A, B 
và c. Mỗi cổng kết hợp với một thanh ghi chốt 8-bit bên trong 
8255A. Đế thiết lập các đường tín hiệu trên cổng, CPU chỉ phải ghi 
một sô" 8-bit vào thanh ghi tương ứng, scí 8-bit sẽ xuât hiện trên các 
đường tín hiệu xuất và sẽ duy trì giá trị ( được chốt ) cho tới khi 
thanh ghi được ghi lần nữa. Đề dùng cổng làm một cổng nhập, CPU 
chỉ phải đọc thanh ghi tương ứng. 

4 

Các chế độ hoạt động khác cung cấp khả năng bắt tay với các 
thiết bị ngoại vi và xuất nhập 2 chiều. Thí dụ để xuả't dữ liệu cho 
một thiết bị không luôn luôn sẵn sàng nhận dữ liệu trong chế độ 
bắt tay, 8255A sẽ đưa dữ liệu lên cổng xuất và đợi thiết bị ngoại vi 
gởi 1 xung trở về báo rằng vừa nhận dừ liệu và yêu cầu dữ liệu kế. 
Mạch logic cần thiết để chốt những xung như vậy và làm cho chúng 
có giá trị đối với CPU được bao gồm bẽn trong phần cứng của 
8255A. 

Từ sơ đồ chức năng của 8255A chúng ta thấy ngoài 24 chân cho 
3 cổng, 8255A còn có 8 đường dữ liệu nối trực tiếp với bus dữ liệu 
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và các đường khác : một đường chọn chip, các đường điều khiển đọc 
và ghi dừ liệu, 2 đường địa chỉ và 1 đường để thiết lập lại trạng thái 
ban đầu cho chip. Hai đường địa chỉ chọn một trong 4 thanh ghi nội, 
tương ứng với các cổng A, B, c và thanh ghi trạng thái. Thanh ghi 
này có các bit xác định cổng nào là cổng nhập và cống nào là cống 
xuất, và những chức năng khác. Bình thường, 2 đường địa chỉ của 
8255A được nối với các bit thấp nhất của bus địa chí. 

3.4.2 Giải mã địa chỉ 

Cho đến lúc này chúng ta đã sơ bộ biết qua cách chọn chip đối 
với các chip bộ nhớ và các chip I/O đã khảo sát. Mục này giúp 
chúng ta xem xét kỹ hơn vấn đề này. Hãy xét một máy vi tính đơn 
giản bao gồm một CPU 8-bit với 16 đường địa chi, một EPROM 2K X 
8 bit cho chương trình, một RAM 2K X 8 bit cho dữ liệu và một PIO. 
Hệ thống nhỏ này có thể được dùng như một mầu ( prototype ) cho 
bộ não của một đồ chơi hoặc của một thiết bị đơn gián. Trong sản 
xuất EPROM có thể được thay thế bằng ROM. 

PIO được chọn theo một trong 2 cách: như một thiết bị I/O thực 
sự hoặc như một phần cũa bộ nhớ. Nếu được chọn như một thiẽt bị 
I/O, chúng ta phải xác định một không gian địa.chỉ I/O rõ ràng, thí 
dụ sử dụng tín hiệu IORQ trên IBM PC bus. Nếu được chọn như một 

phần của bộ nhđ, gọi là I/O được ánh xạ bộ nhớ ( memory-mapped 
I/O ), chúng ta phải dành 4 byte trong không gian dịa chỉ bộ nhớ 
cho 3 cổng 8-bit và thanh ghi điều khiển. Sự chọn lựa sau có hơi tùy 
tiện nhưng ta sẽ chọn theo cách này nhằm minh họa một sô vân đề 
đáng quan tâm trong giao tiêp với I/O. 

EPROM cần 2K không gian địa chỉ, RAM cũng cần 2K và PIO 
cần 4 byte. Do không gian địa chỉ là 64K, chúng ta phải chọn vị trí 
đặt 3 thành phần này vào trong không gian địa chỉ đó. Một khả 
năng được trình bày trong hình 3.22, trong đó EPROM chiêm các 
địa chỉ từ 0 đến 2K, RAM chiếm các địa chỉ từ 32K tới 34K và PIO 
chiếm 4 byte cao nhất cùa không gian địa chỉ từ 65532 tới 65535. 

Theo quan điểm của người lập trình, không có sự khác nhau 
trong việc chọn cách định địa chí cho I/O. Tuy nhiên, đối với vấn đề 
giao tiếp, nếu chúng ta đã chọn dịa chỉ cho PIO thông qua không 
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gian địa chỉ 1/0, ta sè không mất địa chỉ dành cho bộ nhớ ( nhưng 
tất nhiên sẽ mất 4 địa chỉ trong không gian địa chỉ I/O ). 

Với cách phân địa chỉ như trong hình 3.22, một byte của 
EPROM được tham chiếu bởi một địa chỉ bộ nhớ 16-bit có dạng 
OOOOOxxxxxxxxxxx ( nhị phân ). Do EPROM chiêm các địa chỉ từ 0 
đến 2K trong không gian địa chỉ 64 K nên 5 bit cao của địa chỉ đều 
bằng 0. Do vậy, việc chọn chip EPROM có thể thực hiện bằng cách 
sử dụng một bộ so sánh 5-bit, ta sè so sánh 5 đường địa chỉ cao với 
00000 . 



Hình 3.22 Vị trí của EPROM, RAM và PIO trong không gian địa chỉ 64K 

EPROM at address 0 : EPROM ở địa chỉ 0 
RAM at address 8000H : RAM ở địa chỉ 8000H 
PIO at FFFCH ; PIO ở địa chỉ FFFCH 

Phương pháp tốt hơn đề nhận được cùng kết quả là dùng một 
cổng OR có 5 ngõ vào, 5 ngỏ vào này được nôi với các đường địa chỉ 
All - A15. Nếu và chỉ nếu 5 dường địa chỉ này đều bằng 0, ngõ ra 
của cổng OR sẽ bằng 0, do vậy cs được xác lâp ( xác lập ở mức 
thấp ). Trên thực tế không có cổng OR 5 ngõ vào ở các họ SSI 
chuẩn. Cổng NOR 8 ngõ vào dược sản xuất nhiều và có sô' ngõ vào 
tương dối thích hợp, ta sử dụng cổng này bằng cách nối đất 3 ngõ 
vào không dùng và đảo tín hiệu ngõ ra để có cùng kết quả với cổng 
OR 5 ngõ vào, như trong hình 3.23{a). Theo quy ước, các ngõ vào 
không sử dụng sẽ không được vẽ trên sơ dồ mạch. 

Ta cũng dùng cùng nguyên tắc như vậy cho RAM. Các byte của. 
RAM ứng với các địa chỉ nhị phân có dạng lOOOOxxxxxxxxxxx, nên 
cần thêm một còng đảo cho đường địa chỉ A15 như trên hình vẽ. 
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Giải mã địa chỉ cho PIO hơi phức tạp hơn do PIO được chọn bới 4 
địa chỉ có dạng 1111111111 llllxx. Một mạch có thể xác lập cs cho 
PIO chỉ khi trên bus địa chỉ xuât hiện đúng địa chỉ như trình bày 
trong hình vẽ. Ta sử dụng 2 cổng NAND 8 ngõ vào một cổng OR 2 
ngõ vào để nối các đường trên bus địa chỉ với chân cs cùa PIO. Để 
thiết lập mạch logic giải mã địa chỉ cho hình 3.23(a), cần dùng 6 
chip SSI : 4 chip 8 ngõ vào, 1 cổng OR 2 ngõ vào và 1 chip có 3 cổng 
đảo. 

Tuy nhiên, nếu máy tính thực sụ chỉ có một CPU, 2 chip nhớ và 
PIO, ta có thế dùng một thú thuật de đơn gián hóa việc giải mâ dịa 
chỉ. Thủ thuật này thực tế dựa vào tất cả các địa chí cúa EPROM, 
và chỉ có địa chỉ của EPROM có bit A15 bằng 0, ta có thể nối trực 
tiêp cs với A15 như trong hình 3.23(b). Đến đây ta nhận tháy việc 
quyết định đặt RAM ớ địa chỉ 8000H có vẻ bớt tùy tiện. Có thể thực 
hiện giải mã RAM bằng cách chú ý dấn các địa chi của RAM đều có 
dạng lOxxxxxxxxxxxxxx, do vậy chi cần 2 bit là đú. Tương tự, một 
địa chỉ bất kỳ bắt đầu bằng 11 phải là địa chỉ của PIO. Mạch logic 
giải mã đầy đủ bây giờ chỉ cần 2 cổng NAND và 1 cổng đảo. Do 
cổng đảo còn được tạo ra từ 1 cồng NAND bằng cách nối 2 ngỏ vào 
lại với nhau, ta chỉ cần ĩ chip có 4 cổng NAND 2 ngõ vào. Mạch 
logic giải mã địa chỉ ở hình 3.23(b) được gọi là mạch giải mã địa chỉ 
từng phần ( partial address decoding ) do không sứ dụng toàn bộ địa 
chỉ. 

Bất lợi của cách giải mã địa chỉ này là việc đọc ở các địa chỉ 0- 
0010-00000000000 hoặc 0-0011-00000000000 hoặc 0-0100- 
00000000000 sẽ cho cùng kết quả. Thực tế, mọi địa chỉ ở nứa dưới 
của không gian địa chỉ sè chọn EPROM. Do ta không sử dụng các 
địa chỉ khác với OOOOOxxxxxxxxxxx nên sự việc trên không gây một 
tổn hại nào. Tuy nhiên, nếu các nhà thiết kế máy tính muốn có thể 
nâng cấp trong tương lai, họ sẽ không dùng phương pháp giải mã 
địa chỉ từng phần. 

Một kỹ thuật giải mã địa chi thông dụng khác là dùng một chip 
giải mã 3 sang 8 như trình bày trong hình 3.24. 
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Address bus 



(b) 


Hình 3.23 (á) Giải mà địa chỉ toàn phần (b) Giải mã địa chi từng phần. 
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Hình 3.24 Mạch giải mà 3 sang 8 

Bằng cách nối 3 ngõ vào A, B, c của chip với 3 đường địa chỉ cao 
A13, A14 và A15, chúng ta sẽ dược 8 ngõ ra tương ứng với 8K địa 
chỉ đầu tiên, 8K địa chỉ thứ 2 và v.v... Đối với máy tính có 8 chip 
nhớ, mỗi chip có 8K X 8-bit nhớ, dùng chip giải mã như hình 3.24 sẽ 
giải mã địa chỉ hoàn toàn cho máy tính này. Đôi với máy tính có 8 
chip nhớ 2K X 8-bit, chỉ cần một chip giải mã cũng đủ, miễn là các 
chip nhớ được đặt riêng rẽ trong những đoạn 8K trong không gian 
địa chi. 

I 

3.5 TÓM TẮT 

Để hiểu được dễ dàng nội dung của chương 3, các kiên thức cần 
được trang bị bao gồm : 

dại sỏ logic. 

- cách thành lập các mạch tô hợp. 
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cách thành lập các mạch tuần tự. 

câu tạo và hoạt động của các loại bộ nhớ 

câu tạo và hoạt động của các dãy logic lập trình được PLA. 

Các nội dung trên dễ dàng tìm được trong các sách về kỷ thuật 
số, mạch số, v.v,.. . Phần tóm tắt nhât cúa các nội dung này cũng 
dược nhắc lại ở chương 4, câp vi lập trình. 

Các thành phần của một hệ thông máy tính được kết nối qua 
bus. Nhiều, nhưng không phải là tất cả, chân trên chip vi xử lý có 
thế điều khiển trực tiếp một đường bus. Các đường bus có thể chia 
thành các đường địa chỉ, dữ liệu, và điều khiển. 

Bus đồng bộ được điều khiển bởi một xung clock chủ. Bus không 
đồng bộ dùng phương pháp bắt tay hoàn toàn để đồng bộ thiết bị 
phụ thuộc với thiết bị chủ. 

IBM PC bus là một loại bus của máy tính cá nhân tiêu biểu. Hệ 
thông dùng IBM PC bus có 1 CPU 8088, 1 bộ điều khiển bus, 1 bộ 
điều khiển ngắt, 1 chip DMA, một sô mạch chốt và các bộ kích 
cùng những chip khác. 

Đôi với những ứng dụng công nghiệp hiệu suất cao, người ta 
thường dùng VME bus. Bus này hỗ trợ dịa chỉ 32-bit và dữ liệu 32- 
bit, cũng như những địa chỉ và dữ liệu có số bit ít hơn. 

Các thiết bị chuyển mạch, đèn báo, máy in và nhiều thiết bị I/O 
khác có thể giao tiếp được với máy tính dùng các chip I/O song song 
như 8255A, chip I/O nối tiếp UART và USART. 

Những chip này có thể được cấu hình như một phần của không 
gian địa chỉ I/O hoặc một phần của không gian bộ nhớ, nếu cần. 
Chúng có thể được giải mã theo phương pháp toàn phần hoặc từng 
phần, tùy thuộc vào từng ứng dụng cụ thể. 
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Ranh giới giữa phần cứng và phần mềm không được xác định 
rò, hơn nữa lại thường xuyên dịch chuyến. Các máy tính trước đây 
có các chỉ thị số học, logic, dịch, so sánh, lập vòng, v.v... được thực 
thi trực tiếp bởi phần cứng. Với mỗi một chi thị, hiện hừu một 
mạch phần cứng riêng biệt đề thực hiện chỉ thị này. Người ta có 
thể tháo ốc các bản mạch cũ ( back panel ) và chỉ ra các thành 
phần điện tử dùng cho chỉ thị chia, tối thiểu cũng về mặt nguyên 
tắc. 

Trên các máy tính nhiều cấp hiện nay, không còn nữa khả năng 
tách riêng các mạch chia do bởi chúng không hiện hữu. Tất cả các 
chỉ thị có thể có ở cấp máy qui ước ( thí dụ các chỉ thị số học, logic, 
dịch, so sánh và lập vòng ) được thực thi từng bước bởi một trình 
phiên dịch chạy trên cấp vi lập trình. 

Ngày nay, thay vì tìm kiếm các mạch chia chúng ta lấy ra một 
bảng liệt kê của vi chương trình và tìm kiêm phần chương trình 
phiên dịch các chỉ thị chia. 

Mặc dù các chương trình ở một cấp có thể được thực thi bởi một 
trình phiên dịch, và mặc dù trình phiên dịch này cũng có thê được 
thực thi bởi một trình phiên dịch khác, hệ thông cấp bậc này 
không thể tiếp tục đên vô tận. Cấp dưới cùng phải là một máy 
phần cứng thật sự với các mạch tích hợp, các nguồn cung câp và các 
đối tượng “ cứng “ tương tự khác, chúng đã được đề cập đến trong 
chương trước. Trong chương này chúng tí sẽ nghiên cứu cách thức 
vi chương trình điều khiển các thành phần phần cứng và cách thức 
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vi chương trình phiên dịch các chí thị cúa câp máy qui ước. Loại 
máy không được vi chương trình hóa ( không có vi chương trình ) 
( máy RISC ) sẽ được đề cập đến trong chương 8. 

Do cấu trúc cùa cấp vi lập trình, gọi là vi cấu trúc, được xác 
định bơi phần cứng nên thường thô sơ và khó lập trình. Các khảo 
sát về định thì thường quan trọng và chúng dã dẩn Rosin ( 1974 ) 
đến định nghĩa vi lập trình là “ sự hiện thực các hệ thông hợp 
lý đầy triển vọng thông qua sự phiên dịch trên các máy không hợp 

ly 

Cấp vi lập trình có một chức năng đặc biệt : thực thi các trình 
phiên dịch cho các máy ảo khác. Mục đích của thiết kế này hiển 
nhiên dần đến một tổ chức được tôi ưu hóa cao độ đôi với việc tìm- 
nạp, giại mả và thực thi các chỉ thị của cấp máy qui ước, và trong 
một sô' trường hợp, các.chỉ thị phức tạp hơn nữa. Các vân đề và các 
thỏa hiệp liên qua đến việc tố chức và thiết kế cấp vi lập trình được 
khảo sát trong chương này. 

Chúng ta sẽ bắt đầu việc khảo sát cấp vi lập trình bằng việc 
nhắc lại một cách tóm tắt các khối cơ bản trong mạch sô', chúng là 
một phần trong cấu trúc của cáp vi lập trình do vậy cũng liên quan 
đến các vi lập trình viên ( microprogrammer ). Vi lặp trình viên là 
người viêt các vi chương trình, không phải là lập trình viên nhỏ 
( small programmer ). 

Kế đến chứng ta đi vào trọng tâm của vấn đề, cách thức các chỉ 
thị phức tạp hơn được thiết lập từ chuỗi các chỉ thị thô sơ 
( primitive ). Chủ đề này sẽ được thảo luận chi tiết và được minh 
họa bằng một thí dụ bao quát. 

Sau đó, chúng ta xem xét các yếu tố cần phải khảo sát khi thiết 
kế cấp vi lập trình cho một máy tính, từ đó hiểu rõ hơn tại sao phải 
làm như vậy. Các phương pháp cải tiến hiệu suất một máy tính 
cũng được khảo sát ở đây. 

Cuối cùng, chúng ta giới thiệu các thí dụ về cấp vi lập trình của 
các họ vi xử lý Intel và Motorola. 
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4.1 NHĂC LẠI CÂP LOGIC SỎ 

Công việc của vi lập trình viên là viết một chương trình điều 
khiển các thanh ghi, các bus, các ALƯ, các bộ nhớ và các thành 
phần phần cứng khác của máy. Các thành phần này hoặc được tìm 
thấy trong các tài liệu về mạch số hoặc đã được khảo sát trong 
chương trước, ở đây chúng ta chi nhắc lại một cách tóm tắt. Sau 
phần nhác lại, chúng ta sẽ đề cập một cách khái quát về các 
phương pháp khác nhau đề đóng gói chúng. 

4.1.1 Các thanh ghỉ 

Thanh ghi là thành phần lưu trữ thông tin. Cấp vi lập trình 
luôn luôn có một sô thanh ghi nhằm lưu giừ thông tin cần thiết cho 
việc xứ lý chỉ thị đang được phiên dịch. Các thanh ghi đại khái 
cũng giông như bộ nhớ chính, điềm khác nhau là các thanh ghi 
được đặt bên trong bộ xử lý nên chúng được dọc và ghi nhanh hơn 
so với việc đọc và ghi các từ trong bộ nhớ chính, bộ nhớ thường đặt 
bên ngoài chip xử lý. 

Các máy tính lớn hơn và đắt tiền hơn thường có nhiều thanh 
ghi hơn các máy nhỏ và rẽ tiền, chúng phải sứ dụng bộ nhớ chính 
để lưu trữ các kết quả trung gian. Trên một sô' máy tính, một nhóm 
thanh ghi được đánh số 0, 1, 2, ... , n - 1 có giá trị ở cấp vi lập trình 
còn được gọi là bộ nhớ cục bộ ( local ) hay bộ nhớ nháp ( scratchpad 
memory ). 
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Hình 4.1 Thanh ghi 16-l)it lưu giữ 16 bit thông tin 
Bit number : số thứ tự của bit 

Một thanh ghi có thể dặc trưng hóa bằng một con sô' cho biết 
thanh ghi lưu giữ bao nhiêu bit. Hình 4.1 cho thây một thanh ghi 
cùng với qui ước đánh số bit sẽ được dùng trong quyển sách này. 
Thông tin đặt trong thanh ghi sẽ tồn tại cho đến khi có một thông 
tin khác thay thế. Quá trình đọc thông tin ra khỏi một thanh ghi 






















192 


Cấu trúc Máy tính 


ỊịM 


không làm thay đổi nội dung của thanh ghi này, Nói cách khác, khi 
một thanh ghi được đọc, một bản sao nội dung của thanh ghi được 
tạo ra và bản gốc trong thanh ghi không bị xáo trộn. 

4.1.2 Bus 

Bus là tập hợp các đường dây truyền tín hiệu theo dạng song 
song. Thí dụ, các bus được dùng để cho phép nội dung của một 
thanh ghi được sao chép đến một thanh ghi khác. Không giôhg bus 
hệ thống đã khảo sát ở chương 3, các bus này chỉ kết nối 2 thành 
phần do vậy không cần các đường địa chỉ hoặc các đường điều 
khiển bao quát, chỉ cần n đường dữ liệu và trong trường hợp tổng 
quát một hoặc 2 đường điều khiển cũng đủ. Các bus được dùng do 
bởi việc chuyển song song tất cả các bit cùng một lúc sẽ nhanh hơn 
nhiều so với truyền nôi tiếp từng bit một ở mỗi thời điểm, 

Một bus có thể là đơn hướng ( unidirectional ) hay song hướng 
( bidirectional ). Bus đơn hướng chỉ có thể chuyển dữ liệu theo một 
chiều trong khi bus song hướng chuyển dữ liệu theo cả 2 chiều 
nhưng không đồng thời. Các bus đơn hướng điển hình dược dùng để 
nôi 2 thanh ghi, một thanh ghi luôn luôn là nguồn và thanh ghi còn 
lại luôn luôn là đích. Các bus song hướng điển hình được dùng khi 
bất kỳ thanh ghi nào trong tập thanh ghi cũng có thể là nguồn 
hoặc là đích. 

Nhiều thành phần có khả năng tự kết nối hoặc không kết nối 
về mặt điện với bus ( nhưng vẫn kết nối về mặt'vật lý ). Các kết 
nối này có thể được thực hiện hoặc không trong vài nsec. Một bus 
mà các thành phần kết nối có đặc tính này dược gọi là bus 3 trạng 
thái ( tri-state bus ) vì mỗi một đường của bus có thể là 0, 1 hoặc 
không kết nối. Các bus 3 trạng thái được sử dụng rộng rãi khi có 
nhiều thành phần nôi đến bus và chúng đều có khả năng đưa thông 
tin lên bus. 

Hình 4.2(a) mô tả một thanh ghi 8 bit được nôi với một bus 
nhập và một bưs xuất. Thanh ghi bao gồm 8 ílipAop loại D, mỗi 
ílipílop lưu giữ 1 bit và được nối với bus xuất qua một cổng đệm 
không dảo. Thanh ghi có 2 tín hiệu điều khiển, CK và cho phép 
xuất OE ( output enable ), nối đến tất cả các ílipílop. Bình thường 2 
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tín hiệu này ở trạng thái tĩnh nhưng thính thoảng chúng được xác 
lập, gây nên tác động tương ứng. Khi CK không xác lập, nội dung 
của thanh ghi không bị ảnh hưởng bời các tín hiệu trên bus. Khi 
CK xác lập, thanh ghi được nạp từ bus nhập. Khi OE không xác 
lập, thanh ghi không được kết nôi với bus xuất. Ngược lại khi OE 
được xác lập, nội dung của thanh ghi được đặt lên bus xuất ( thanh 
ghi xuất thông tin lên bus ). 



(a) 


Ffom c bus 


16 

-V— 


16-btt reglster 


CK 


16 
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To A bus 
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Hình 4.2 (a) Chi tiết một thanh ghi 8-bit nối với một bus nhập và một bus 
xuất (b) Ký hiệu của một thanh ghi 16'bit với một bus nhập và 2 bus xuât 
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Input bus : bus nhập 
8-bit register : thanh ghi 8-bit 
Control signals : các tín hiệu điều khiển 
Output bus : bus xuất 

Nếu có một thanh ghi khác, R chẳng hạn, có các ngõ vào nối với 
bus xuất của thanh ghi vừa mô tả ở trên, thanh ghi này có thể 
truyền thông tin đến R. Để thực hiện điều này, OE phải được xác 
lập và giữ ớ trạng thái này đủ lâu để thông tin đưa lên bus ổn định. 
Kế đến đường CK của R được xác lập để nạp cho R thông tin này. 
Thao tác mở cổng đưa thông tin của một thanh ghi lên bus để một 
thanh ghi khác nạp vào thường xảy ra ở cấp vi lập trình. Hình 
4.2íb) trình bày một thanh ghi 16-bit với 2 bus xuất, mỗí bus được 
điều khiển bởi một tín hiệu OE khác nhau. 

4.1.3 Mạch chọn kênh và giải mả 

Mạch chọn kênh { muitiplexer ) có 2 n ngõ vào dữ liệu ( các 
đường riêng rẽ hoặc các bus ), một ngõ ra dữ liệu có cùng độ rộng 
với các ngõ vào, một ngõ điều khiên rc-bit chọn một trong các ngõ 
vào và dẫn đường ngõ vào này đến ngõ ra. Hình 4.3(a) trình bày 
một mạch chọn kênh với 2 ngõ vào là 2 bus A và B. Một tín hiệu 
điều khiên 1-bit chọn hoặc A hoặc B được đưa đến ngõ ra. Ngược 
với mạch chọn kênh là mạch phân đường ( demultiplexer ), mạch 
này có 1 ngõ vào ( đường riêng rẽ hoặc 1 bus ) được dẫn đường để 
xuất hiện ở 1 trong 2 n ngõ ra, phụ thuộc vào giá trị của n bit điều 
khiển. 

Mạch giải mã ( decoder ) có n đường vào và 2 n đường ra được 
đánh số từ 0 đến 2 n - 1. Nếu mã nhị phân ở các đường vào là k, 
đường ra k sè ờ logic 1 còn tất cả các đường ra khác ở logic 0. Mạch 
giải mã luôn luôn có một đường ra là 1, các đường ra còn lại là 0. 
Hình 4.3(b) trình bày dưới dạng ký hiệu mạch giải mã 4 -ỳ 16. 
Ngược lại với mạch giải mã là mạch má hóa ( encoder ), với 2" 
đường vào và n đường ra. Chỉ có một đường vào ở logic 1, tất cả các 
đường khác đều ờ logic 0. Khi có một đường vào ở logic 1, một số 
nhị phân tương ứng xuất hiện ờ các đường ra. 
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Hình 4.3 (a) Mạch chọn kênh 2-^1 (b) Mạch giải mã 4 16 

ỉnput ; ngõ vào 
Control : điều khiển 

2 to 1 multiplexer : mạch chọn kênh 2 -> 1 
Output : ngõ ra 

4 to 16 deco'der : mạch giải mả 4 -) 16 

4.1.4 ALU và mạch dịch bỉt 

Mỗi một máy tính cần một phương tiện dể tính toán. Mạch dơn 
giản nhâ't là mạch cộng ( adder ), mạch này nhận 2 ngõ vào n-bit 
và tạo tổng sô" của chúng ở ngỏ ra. Một mạch sô" tổng quát hơn gọi 
là ALƯ hoặc đơn vị sô" học logic ( arithmetic logical unit ). Mạch 
này ngoài 2 ngõ vào dữ liệu tt-bit và một ngõ ra, còn có một sô ngõ 
vào và ngõ ra điều khiên. ALU trong hình 4.4(a) có 2 bit chiíc nâng, 
F0 và Fl, dùng để xác định chức năng ALƯ phải thực hiện. Với thí 
dụ của chúng ta trong phần 4.1 này, ALƯ thực hiện các phép tòán 
A + B, A AND B , cho A qua không đổi ( tạo một bản sao của A à 
ngõ ra ) và lây bù A. Chức năng thứ ba dường như vô nghĩa, nhưng 
chúng ta sẽ được thây công dụng sau này. 

ALƯ còn có các ngõ ra điều khiển. Các ngõ ra điển hình là các 
đường có giá trị 1 khi các phép toán cho kết quả âm, hoậc khi kết 
quả bằng 0, hoặc khi có số nhớ ( carry ) từ bit cao nhất hoặc khi 
xảy ra tràn. ALU trong hình 4.4(a) có 2 ngõ ra điều khiển, cho biết 
kết quả của các phép toán là âm ( ngõ ra N ) hoặc bằng không 
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( ngõ ra z ). Bit N chỉ là bản sao của bit cao nhât trong kết quả còn 
bit z được tạo ra từ thao tác NOR tất cả các bit của kêt quả. 



Hình 4.4 (a) ALU (b) Mạch dịch bit . 

ALƯ : đơn vị sỏ học logic 
Shiíter : mạch dịch bit 

Mặc dù một số ALU có thể thực hiện được các thao tác dịch bit, 

phần đông chúng có một đơn vị dịch bit riêng rẽ. Mạch này có thể 

dịch một ngõ vào nhiều bít ( multibit input ) sang trái hay sang 

phải 1-bit hoặc không dịch. Hình 4.4(b) cho ta ký hiệu của một 

mạch dịch bit. 

* « 

4.1.5 Mạch tạo xung clock 

Các mạch của máy tính thường được điều khiển bởi 1 mạch tạo 
các chuỗi xung tuần hoàn gọi là xung clock. Xung clock xác định chu 
kỳ của máy tính. Trong mỗi một chu kỳ máy, một hành động nào 
đó xảy ra, như thực thi một vi lệnh chẳng hạn. Một chu kỳ máy 
thường được chia thành các chu kỳ con ( subcycle ), sao cho các 
phần khác nhau của vi lệnh được thực hiện theo một trật tự xác 
định. Thí dụ các ngõ vào của ALƯ phải có giá trị và ổn định trước 
khi kết quả ở ngõ ra được lưu trữ. 

Hình 4.5(a) trình bày dạng ký hiệu của một mạch tạo xung clock 
với 4 ngõ ra. Ngõ ra trên cùng là ngõ ra chính, ba ngỏ ra còn lại 
được tạo ra bằng cách trì hoãn ngõ ra chính với các khoảng thời 
gian khác nhau. Xung clock chính trên hình 4.5(b) có độ rộng xung 
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bằng V* thời gian một chu kỳ. Các xung clock khác được trì hoản các 
khoang thời gian dài bằng 1, 2 và 3 lần độ rộng xung so với xung 
clock chính. Kết quả cho thấy ta có mạch chia mỗi chu kỳ máy 
thành 4 chu kỳ con có cùng dộ dài. 



1 cycle 


1 subcycle 

1 


1 


n_ 


(a) 


<b) 


Hình 4.5 (a) Mạch tạo xung cìock 4 ngo ra (b) Giản đồ thời gian 

Clock : mạch tạo xung clock 
Delay : mạch trì hoản 
Cycle : chu kỳ 
Subcycle : chu kỳ con 


4.1.6 Bộ nhớ chính 

Các bộ xử lý cần khả năng đọc dừ liệu từ bộ nhớ và ghi dữ liệu 
lên bọ nhớ. Hầu hết các máy tính có một bus địa chì, một bus dữ 
liệu và mặt bus điều khiển dể truyền thông giữa CPU và bộ nhớ 
Để dọc dữ liệu của bộ nhớ, CPU phải đặt địa chỉ bộ nhớ lên bus địa 
chỉ và thiết lập các tín hiệu điều khiển thích hợp thí dụ xác lập RD 
( READ ). Ke đến bộ nhớ dạt dừ liệu được yêu cầu lên bus dữ liệu. 
Trong nhiều máy tính việc đọc / ghi bộ nhớ là đồng bộ. nghĩa la bọ 
nhớ phải dáp ứng trong một khoảng thời gian xác dmh. Tren mộ 
so may khác, bộ nhớ có thể thực hiện công việc nêu trên bao âu 
tuy V, sau đo báo hiệu sự hiện diện của dữ liệu trên busbang cách 
sử dụng một đường diều khiển khi kết thúc công việc. Việc đọc ghi 

như vậy là không dồng bộ. 
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Thao tác ghi bộ nhớ cũng được thực hiện tương tự. CPU đặt dữ 
liệu cần ghi lên bus dữ liệu và địa chỉ bộ nhớ lên bus địa chỉ, sau đó 
xác lập WR { WRITE ). ( Một cách để có RD và WR là có MREQ, 
cho biết bộ nhớ được yêu cầu, và R/W dùng để phân biệt việc đọc và 
ghi ). 

Thời gian truy xuât bộ nhớ hầu như luôn luôn dài hơn đáng kể 
so với thời gian thực thi một vi lệnh, do vậy vi chương trình phải 
giữ các giá trị đúng trên bus địa chỉ và bus dữ liệu trong vài vi 
lệnh. Để đơn giản hóa công việc này, tiện nhất là có 2 thanh ghi, 
thanh ghi địa chi bộ nhớ MAR ( memory address register ) và 
thanh ghi đệm bộ nhớ MBR ( memory buffer register ), chúng đệm 
các bus địa chỉ và bus dữ liệu. Đối với mục đích của chúng ta, rất 
tiện lợi khi sắp xếp các bus như trong hình 4.6. Cả 2 thanh ghi 
dược đặt giừa CPU và bus hệ thông. 


CPU Bus 

Address 

Controt 

Data bus 


Address bus 




Hình 4.6 Các thanh ghi đệm cho bus địa chỉ và bus dữ liệu 

CPU : đơn vị xử lý trung tâm 
Bus : bus 
Address : địa chỉ 
Control : điều khiến 
Address bus : bus địa chì 
Data out : bus “ dừ liệu xuất “ 

Data in : bus “ dừ liệu nhập “ 

Data bus : bus dữ liệu ( của hệ thống ) 

RD signal : tín hiệu RD 
WR signal : tín hiệu WR 
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Bus địa chỉ là một chiều trên cả hai phía và được nạp từ phía 
CPU khi đường điều khiển được xác lập. Ngõ ra tới các đường địa 
chỉ của hệ thông luôn luôn được phép ( hoặc chỉ được phép trong 
khi đọc hoặc ghi, điều này đòi hỏi thêm một đường cho phép xuất 
được tạo ra bằng cách OR các đường RD và WR, không vẽ trong 
hình 4.6 ). Khi có đường điều khiển cùa MBR, dữ liệu được nạp từ 
bus “ dữ liệu nhập “ ( data in ) ở phía CPU. Bus “ dữ liệu xuất “ 
( data out ) luôn luôn được phép. Bus dữ liệu cũa hệ thông là hai 
chiều, xuât ra từ MBR khi WR được xác lặp và nạp vào MBR khi 
RD được xác lập. 

4.1.7 Đóng gói 

Trong các mục trước chúng ta đã nhắc qua một số các mạch 
khác nhau, chúng được kết hợp đế tạo thành một máy tính. Các 
mạch này tồn tại dưới một sô dạng khác nhau trên thị trường. ít 
phức tạp nhất là đóng gói dưới dạng tích hợp mức trung bình MSI 
( medium scale integration J, với mỗi một chip chứa một thành 
phần, thí dụ một thanh ghi, một ALƯ hoặc một mạch dịch bit. 
Cách này được minh họa ở hình 4.7(a). Các thành phần này được 
nôi dây với nhau để tạo thành máy tính. Nhiều máy tính được chế 
tạo theo cách này do có rất nhiều chip MSI tôc độ cao, giá hạ. 

Trở ngại chính khi xây dựng máy tính từ các chip MSI là phải 
cần một số lượng lớn các chip. Chúng chiếm nhiều board, tiêu thụ 
nhiều công suất và tiêu tán một lượng nhiệt đáng kể. Sứ dụng các 
bit-slice chip là một kỹ thuật khác. Mỗi một bit-slice chip có, thí dụ, 
các thanh ghi 1-bit, ALƯ 1-bit và các thành phần 1-bit khác. Chúng 
ta dễ dàng mơ rộng thiết kế này để thêm vào, thí dụ, 16 thanh ghi 
1-bit, một mạch dịch bít 1-bit và các thành phần 1-bit khác. Với 32 
chip như vậy và đặt chúng cạnh nhau, chúng ta có một máy với 16 
thanh ghi 32-bit, bộ ALƯ 32“bit, mạch dịch bit 32-bit, v.v... . Như 
vậy, chỉ với 16 chip chúng ta có thể xây dựng một máy 16-bit. Các 
bit sỉice cho các nhà thiết kế khả năng đưa ra một máy với chiều 
dài từ bất kỳ một cách dễ dàng. Các bit slỉce với 2 hoặc 4 bit mỗi 
sỉice cũng được dùng rộng rải. Hình 4.7(b) mô tả một máy 8-bit 
được xây dựng bằng bốn sỉice 2-bit. Tổng quát, phương pháp bit- 
sỉice yêu cầu ít chip hơn và thời gian thiết kế giám nhiều so với 
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phương pháp MSI, tuy nhiên các máy tạo ra thường có tốc độ chậm 
hơn. 


Reglsters 



LU 


LU 


LU 

m 


m 


m 

m 


m 


m 

m 


m 


m 

LL7 





rm 


rTĨ1 


ÍYV1 


(b) 



Hình 4.7 Ba cách xây dựng một máy tính (a) Các chip MSI (b) bỉt-slice 

(c) ChipLSI 

Registers : các thanh ghi 
ALƯ : đơn vị sô học logic 
Shiíter : mạch dịch bit 

• 

Phương pháp thứ ba dùng kết hợp các thành phần là đưa ra một 
bộ xử lý hoàn chỉnh vào trong một chip đơn ( xem hình 4.7(c) ). 
Phương pháp này tuy giảm số lượng chip xuống còn 1 nhưng lại tồn 
tại một số bất lợi. Trước tiên, công nghệ cần cho việc đóng gói một 
số lượng lớn các thành phần trên một chip sẽ khác với công nghệ 
của các chip MSI và bit-slice và thường tạo ra các máy chậm hơn. 
Hơn nừa, cả 2 công nghệ thiết kế và sản xuất sè rất phức tạp và 
đát tiền. Ngược lại, bất kỳ một kỹ sư điện lành nghề nào cũng có 
thể thiết kế một máy tính đơn giản từ các chip MSI hay bit-slice 
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mà không gặp nhiều trở ngại. Từ quan điểm của một nhà sản xuât 
máy tính, người kỳ vọng vào việc thiết kế máy tính từ nhiều năm, 
điều đáng lo lắng là làm chú các công nghệ cần thiết để tạo ra các 
bộ xử lý đơn chip. Với một công ty chỉ cần máy chuyên dụng, không 
có gì phải lo. Các lựa chọn trở thành việc sứ dụng một bộ xử lý có 
sẵn trên thị trường, ký kết giao kèo thiết kế và sản xuất một chip 
chuyên dụng, hoặc xây dựng chip từ các thành phần MSI hay bit - 
slice . 

4.2 MỘT VI CẤU THỨC MAU 

Đến đây chúng ta đã nhắc qua tất cả các thành phần cơ bản câu 
tạo nên cấp vi lập trình, bây giờ ta xem xét cách thức kết nối 
chúng. Trong lĩnh vực này do các nguyên lý chung không nhiều và 
khá khác biệt nhau, chúng ta sẽ giới thiệu chù đề này thông qua 
một thí dụ chi tiết. 

4.2.1 Đường dữ liệu 

Đường dữ liệu (. data path ) cùa vi câu trúc mẫu dược trình bày 
trong hình 4.8. ( Đường dừ liệu là phần của CPU bao gồm cả ALU, 
các ngõ vào và các ngõ ra của ALƯ ). Đường dữ liệu có 16 thanh ghi 
16-bit giông nhau, ký hiệu là PC, AC, SP, v.v... , chúng tạo thành bộ 
nhớ nháp chỉ được truy xuất bởi cấp vi lập trình. Các thanh ghi ký 
hiệu 0, +1, -1 dùng để lưu giừ các hằng sô', ý nghĩa của tên các 
thanh ghi khác sẽ được giải thích sau. ( Thật ra, 0 không được sử 
dụng trong các thí dụ đơn giản nhưng chắc chắn sè cần đến trong 
các máy phức tạp hơn nên vẫn được kể đến, chúng ta đang có nhiều 
thanh ghi hơn cần thiết trong thí dụ mẫu ). Mỗi một thanh ghi có 
thể xuâ't nội dung lên trên 1 hoặc 2 bus cục bộ, bus A và bus B, 
hoặc nạp nội dung của bus thứ 3, bus c như trên hình vẽ. 

Các bus A và B dẫn dữ liệu đến một ALƯ 16-bit, ALU này thực 
hiện được 4 chức năng ỉ A + B, A AND B, A và NOT A. Chức năng 
cần thực hiện được xác định nhờ 2 đường điều khiển ALƯ, F0 và 
Fl. ALU tạo ra 2 bit trạng thái dựa trên kết quả hiện hành : bit N 
được thiết lập khi kết quả của ALU âm và bit z được thiết lập khi 
kết quả của ALU bằng 0. 
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Kêt quà của ALƯ được đưa đến một mạch dịch bit có khả năng 
dịch sang trái hoặc sang phái 1-bit hoặc không dịch. Khi cần dịch 
một thanh ghi R sang trái 2-bit, ta tính R + R bên trong ALƯ 
( tương dương dịch trái 1-bit ), sau dó dịch tổng sô sang trái một bit 
nhờ mạch dịch bit. 

Cả 2 bus A và B đều không trực tiếp đưa dữ liệu đên ALƯ. Thay 
vào đó, 2 bus này được nối với 2 mạch chót ( ỉatch ), nghĩa là 2 
thanh ghi, rồi các mạch chôt này mới cung câp dừ liệu cho ALƯ. 
Cần cỏ các mạch chót vì ALU là một mạch tố hợp, trạng thái ngõ 
ra tùy thuộc tức khắc ( bó qua thời gian trì hoãn truyền trong 
ALƯ ) vào trạng thái các ngỏ vào và các mã chức năng. Cơ câu này 
gây ra các vấn đề khi tính toán, thí dụ sau khi tính A := A + B, 
thanh ghi A được chứa vào nên giá trị trên bus A bắt đầu thay đổi, 
kéo theo ngò ra cùa ALƯ ( kết quả ) rồi đến bus c cũng thay đối 
dẫn đến kết quả sai được lưu vào thanh ghi A. Mật khác trong phép 
gán A := A + B, A ò vế phải là giá trị ban đầu của thanh ghi A, 
không có sự xáo trộn nào giữa giá trị cũ và giá trị mới. Bằng cách 
thêm và các mạch chốt trên các bus A và B, ta có thể ổn định các 
giá trị ban đầu của A và B ớ các mạch chót trước một chu kỳ, ALƯ 
cách ly với các giá trị mới trên bus khi chúng được lưu vào các 
thanh ghi. Việc nạp cho các mạch chốt được điều khiển bởi LO và 
Ll. 

Cần chỉ rõ rằng giải pháp của chúng ta đôi với vãn đề này 
không phải là duy nhất. Nếu tất cả các thanh ghi là các ílipílop hơn 
là các mạch chôt, việc thiêt kê 2 bus có thể thực hiện bằng cách 
nạp các toán hạng trên các bus A và B trước 1 chu kỳ và đọc kết 
quả từ một trong các bus sau một chu kỳ. Chọn lựa cách thiết kế 2 
hoặc 3 bus kéo theo độ phức tạp, cơ chê song song và sô lượng 
đường nối. Giải quyết chi tiết các vấn đề vừa nêu không thuộc 
phạm vi quyến sách này. 

Để truyền thông với bộ nhớ, chúng ta đưa các thanh ghi MAR 
và MBR vào trong vi cấu trúc. Thanh ghi MAR được nạp địa chỉ từ 
mạch chốt B nhờ vào đường điều khiển MO ( lúc này nội dung của 
mạch chốt B là địa chỉ, không phải dữ liệu ). Khi ghi kết quả lên bộ 
nhớ, nội dung của mạch dịch bit được nạp cho MBR cùng lúc với, 
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Hình 4.8 Đường dữ liệu cúa vi cấu trúc mẩu dùng ở chương này 
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A, B, c bus : bus A, B, c 
A, B latch : mạch chốt A, B 
Address out : địa chỉ xuát 
Data in : dữ liệu nhập 
Amux : mạch chọn kênh 
ALU : đơn vị số học logic 
Shifter : mạch dịch bit 
Data out : dữ liệu xuất 
To address bus : đến bus địa chỉ 
To data bus : đến bus dữ liệu 

hoặc thay vì, lưu kết quả vào bộ nhớ nháp trong CPU. MI điều 
khiển nạp dữ liệu cho MBR, M2 và M3 điều khiển đọc và ghi bộ 
nhớ. Khi đọc dữ liệu từ bộ nhớ, dữ liệu hiện diện ở ngõ vào bên trái 
cua ALƯ thông qua mạch chọn kênh Amux trong hình 4.8. Đường 
điều khiển AO xác định hoặc mạch chốt A hoặc thanh ghi MBR đưa 
dữ liệu đến ALƯ. Vi cấu trúc ơ hình 4.8 tương tự với vi cấu trúc của 
các bit-slice có trên thị trường. 

4.2.2 Vi lệnh 

Để điều khiển đường dử liệu của hình 4.8 ta cần 61 tín hiệu, 
chia thành 9 nhóm chức năng như sau : 

16 tín hiệu diều khiển nạp cho bus A từ bộ nhớ nháp 

16 tín hiệu diều khiển nạp cho bus B từ bộ nhớ nháp 

16 tín hiệu điều khiển nạp cho bộ nhớ nháp từ bus c 

2 tín hiệu điều khiển 2 mạch chốt A và B 

2 tín hiệu điều khiển các chức năng của ALU 

2 tín hiệu điều khiển mạch dịch bit 

* # ■ 

4 tín hiệu điều khiển MAR và MBR 
2 tín hiệu xác định việc đọc bộ nhớ và ghi bộ nhớ 
1 tín hiệu điều khiến Amux 

Cho sẵn các giá trị cúa 61 tín hiệu, chúng ta thực hiện được một 
chu kỳ của đường dữ liệu. Một chu kỳ bao gồm việc đưa các giá trị 
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lên bus A và bus B, chốt chúng vào 2 mạch chô't bus, thực thi công 
việc của ALU và mạch dịch bit, cuối cùng cất kết quả vào bộ nhớ 
nháp hay/và MBR. Ngoài ra, MAR cũng có thể được nạp địa chỉ và 
một chu kỳ bộ nhớ được khởi động. Như vậy trước tiên coi như 
chúng ta cần có 1 thanh ghi 61-bit, mỗi bit ứng với một tín hiệu. 
Bit có giá trị 1 nghĩa là tín hiệu tương ứng được xác lập, ngược lại 
giá trị 0 của bít cho biết tín hiệu không xác lập. 


Tuy nhiên, với giá phải trả cho sự gia tăng dù nhỏ trong mạch, 
chúng ta phải giảm đáng kể sô bit cần cho việc điều khiển đường 
dữ liệu. Trước tiên chúng ta có 16 bit điều khiển 16 thanh ghi xuất 
dữ liệu lên bus A, nhưng ờ mỗi thời diểm chỉ có một thanh ghi được 
xuất. Do vậy ta có thể mã hóa thông tin điều khiển của bus A 
bằng 4 bit và dùng một mạch giải mã 4 16 tạo ra 16 đường điều 

khiển. Tóm lại thay vì phải dùng 16 đường điều khiển như lúc ban 
đầu, ta thay bằng 4 đường diều khiển và một mạch giải mã 4 “> 16. 
Cùng tương tự như vậy cho 16 bit điều khiển xuất dừ liệu từ 16 
thanh ghi lên bus B. 

Tình huống đôi với bus c hơi khác, trên nguyên tắc việc lưu giừ 
dữ liệu đồng thời vào các thanh ghi của bộ nhớ nháp có thể thực 
hiện được. Trên thực tế, dặc tính này hầu như không bao giờ sử 
dụng và hầu hết phần cứng không hồ trợ điều này. Do vậy ta cũng 
dùng 4 bit đế mả hóa 16 đường điều khiển nhập dữ liệu vào 16 
thanh ghi, ở mồi thời điểm chỉ có một thanh ghi được nhập dữ liệu 
từ bus c. Sô' bit tiết kiệm được là 3 x 12 = 36 bit, nghĩa là chúng ta 
chỉ cần 25 tín hiệu diều khiển đường dữ liệu của hình 4.8. LO và LI 
luôn luôn được cần đến tại những thời điểm cô' định nên chúng'được 
cung cấp bởi mạch tạo xung clock. Sô tín hiệu điều khiển còn lại 23. 
Một tín hiệu được thêm vào, tuy không yêu cầu nghiêm ngặt, nhưng 
thường sử dụng để cho phép hay không cho phép cất kết quả vào bộ 
nhớ nháp. Trong nhiều tình huống, thỉnh thoảng người ta muôn 
thực hiện một chức năng của ALƯ để tạo ra các tín hiệu N và z, 
không chú ý đến kết quả sinh ra và việc cất giữ. Bit thêm vào được 
gọi là cho phép c ENC ( enable c ), với ENC = 1 cho phép dữ liệu 
từ bus c được lưu vào 1 trong các thanh ghi và ngược lại không cho 
phép khi ENC = 0 
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Đến đây ta cần 24 bit để điều khiển đường dữ liệu của hình 4.8. 
Lưu ý rằng ta có thể dùng RD và WR để điều khiển chcít MBR từ 
bus dữ liệu hệ thông và cho phép MBR đưa dữ liệu lên bus này. 
Nhận xét này giúp giảm sô' tín hiệu điều khiển độc lập xucíng còn 
22 . 

Bây giờ ta tạo ra khuôn dạng vi lệnh chứa 22 bit cho vi cấu trúc. 
Hình 4.9 trình bày một khuôn dạng như vậy với 2 trường ( íĩeld ) 
được thêm vào là COND và ADDR, chủng được mô tả sau. Vi lệnh 
chứa 13 trường, trong đó có 11 trường được liệt kê như sau : 

Bits 1 2 2 2111114 4 4 a 


A 

c 



M 

ồ 

R 

M 

A 

R 








M 

ủ 

X 

0 

N 

D 

ALU 

SH 

R 

D 

w 

R 

E 

N 

c 

c 

B 

A 

ADDR 


_L 

_ 1 _ 

— 1 _ 1 






,111 

-Lự 

ỉ 1 1 

-L-LU-LLl 


AMUX COND ALU SH MBR, MAR, RO, WR, ENC 

9= Ạlạtch 9= No jump 0= A + B 0= No shifỉ 0= No 

1 = MBR 1 = Jump |ị N = 1 1 = Ạ AND B 1 = Shitt right 1 bit 1= Yes 

2= Jump if Z=1 2= ộ 2= Shitl len 1 bít 

3= Jump alvvays 3= A 3= (not used) 

Hình 4.9 Dạng cùa vi lệnh điều khiển đường dữ liệu ở hình 4.8 

Amux ( 0 = A latch, 1 = MBR ) ; trường diều khiển chọn kênh ( 0 s dữ liệu 
từ mạch chốt A đưa đến ALU, 1 = dữ liệu từ MBR đưa đến ALƯ ) 

COND ( 0 = No jump, 1 = jump if N = 1, 2 = jump if z a 1, 3 s jump 

always ) : trường điều kiện COND 2-bit ( 0 = khóng nhảy, 1 = nhảy nếu N 
= 1 [ kêt quá âm ], 2 = nháy nếu z = 1 [ kết quả bằng không ], 3 = nhảy 
không điều kiện ) 

ALƯ { 0 = A + B, 1 = A AND B, 2 = A, 3 = NOT A ) : trường điều khiển 
ALƯ í 0 = thực hiện A + B, 1 = thực hiện A AND B, 2 = két quà của ALƯ 
là bản sao cùa A, 3 = thực hiện NOT A ) 

SH ( 0 = no shift, 1 = shift right 1-bit, 2 = shiít ỉeft 1-bit, 3 = not used ) : 
trường điều khiến dịch bit SH ( 0 = không dịch bit, 1 = dịch phải 1-bit, 2 = 
dịch trái 1-bit, 3 = không sử dụng ) 

MBR, MAR, RD, WR, ENC { 0 = No, 1 = Yes ) : các trường điều khiển 
thanh ghi MBR, thanh ghi MAR, đọc bộ nhớ, ghi bộ nhớ, cất kết quá vào 
bộ nhớ nháp ENC ( 0 = không điều khiển, 1 = điểu khiển ) 
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Amux - điều khiển chọn dừ liệu hoặc từ mạch chỏt A ( Amux = 
0 ) hoặc từ MBR ( Amux = 1 ) dưa đến ALƯ. 

ALƯ - chọn chức năng của ALU hoặc A + B ( ALU = 00 ) hoặc 
A AND B ( ALƯ = 01 ) hoặc A ( ALƯ = 10 ) hoặc NOT A ( ALU = 

11 ). 

SH - chọn chức năng của mạch dịch bit hoặc không dịch ( SH = 
00 ) hoặc dịch phải ( SH = 01 ) hoặc dịch trái ( SH = 10 ). 

MBR - nạp dữ liệu cho MBR từ mạch dịch bit í MBR = 1 ) hoặc 
không nạp ( MBR =: 0 ). 

MAR - nạp địa chỉ cho MAR từ mạch chốt B ( MAR = 1 ) hoặc 
không nạp ( MAR = 0 ). 

RD - yêu cầu đọc bộ nhớ và nạp cho MBR { RD = 1 ) hoặc 
không đọc ( RD = 0 ). 

WR - yêu cầu ghi dử liệu cũa MBR vào bộ nhớ ( WR = 1 ) hoặc 
không ghi ( WR = 0 ). 

ENC - điều khiển cất kết quả cúa ALU vào bộ nhớ nháp ( ENC 
= 1 ) hoặc không cất ( ENC = 0 ). 

c - chọn thanh ghi để cất kết quả của ALƯ nếu ENC = 1. 

B - chọn thanh ghi để xuât dữ liệu hoặc địa chỉ lên bus B. 

A - chọn thanh ghi để xuât dừ liệu lên bus A. 

Trật tự của các trường trong hình 4.9 hoàn toàn ngầu nhiên. 
Trật tự được chọn ớ đây nhằm tối thiếu hóa các đường cắt nhau 
trong hình 4.10 í thông thường các đường cắt nhau trong hình cũng 
tương ứng với các đường cắt nhau trên board mạch in hay trên chip, 
chúng tạo ra các rắc rối trong các thiết kê 2 chiều ). 

4.2.3 Định thì vỉ ĩệnh 

Mặc dù kết luận cùa chúng ta về cách thức một vi lệnh điều 
khiển đường dữ liệu trong suốt 1 chu kỳ hầu như đầy đti, cho đến 
bây giờ chúng ta đã bỏ quên một vấn đề : định thì ( timing ). Một 
chu kỳ cơ bản của ALU bao gồm việc thiết lập các mạch chót A và 
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B, cho ALU và mạch dịch bit thời gian để chúng thực hiện công 
việc và cất các kết quả. Hiển nhiên các sự kiện này phải xảy ra 
theo một chuỗi vì nếu chúng ta cô lưu giữ dữ liệu trên bus c vào bộ 
nhớ nháp trước khi các mạch chôt A và B được chốt, rác ( dữ liệu 
sai hay không cần thiết ) sẽ dược lưu giữ thay vì là dữ liệu. Để 
nhận được một chuỗi sự kiện đúng, chúng ta giới thiệu một mạch 
tạo xung clock có 4 pha xung, nghĩa là có 4 chu- kỳ con như trong 
hình 4.5. Các sự kiện chính trong thời gian của 4 chu kỳ con là : 

1. Nạp vi lệnh kế sẽ thi hành vào 1 thanh ghi gọi là thanh 
ghi vi lệnh MIR ( micro-instruction register ). 

2. Đưa nội dung 2 trong các thanh ghi lên các bus A và B 
và chốt chúng vào các mạch chốt A và B. 

3. Các ngõ vào của ALƯ ổn định, cho ALU và bộ dịch bít 
thời gian để kết quả ổn định ở ngõ ra và nạp địa chỉ cho 
MAR nếu có yêu cầu. 

4. Ngõ ra của mạch dịch bit ổn định, cất dữ liệu trên bus c 
vào bộ nhớ nháp và nạp dữ liệu này cho MBR nếu cả hai 
được yêu cầu. 

Hình 4.10 là một sơ đồ khối chi tiết về vi cấu trúc hoàn chỉnh 
của máy mẫu của chúng ta. Sơ đồ này đáng cho chúng ta nghiên cứu 
cẩn thận. Một khi đã hiểu rõ từng khối và từng đường trên hình vẽ, 
chúng ta sẽ hiểu dễ dàng cấp vi lập trình. Sơ đồ khôi có 2 phần, 
đường dữ liệu bên trái ( đã khảo sát chi tiết ) và phần điều khiển 
bên phải ( sẽ xem xét ngay bây giờ ). 

Hạng mục quan trọng nhất và lớn nhất trong phần điều khiển 
của máy là bộ nhớ điều khiển ( control store ). Bộ nhớ chuyên dụng 
và tốc độ cao này cất giữ các vi lệnh. Trên một số máy là bộ nhớ 
ROM, trên một số máy khác là bộ nhớ RAM. Trong thí dụ của 
chúng ta, các vi lệnh sẽ dài 32 bit và không gian địa chỉ vi lệnh là 
256 từ 32-bit, như vậy bộ nhớ điều khiển có dung lượng cực đại 256 
X 32 = 8192 bít. 

Giống như mọi bộ nhớ khác, bộ nhớ điều khiển cần thanh ghi 
MAR và thanh ghi MBR. Chúng ta sẽ gọi MAR là bộ đếm vi chương 
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trình MPC ( microprogram counter ) vì chức năng duy nhất của 
thanh ghi này là trỏ đến vi lệnh kế sè được thực thi. Thanh ghi 
MBR chính là MIR đã đề cập ở trên. Bộ nhớ điều khiển và bộ nhớ 
chính hoàn toàn khác nhau, bộ nhớ đầu lưu giữ vi chương trinh còn 
bộ nhớ sau chứa chương trình của ngôn ngữ máy qui ước ( conven- 
tional machine language program ). 

Từ hình 4.10 ta thấy bộ nhớ điều khiển liên tục sao chép vi 
lệnh được địa chỉ hóa bởi MPC vào thanh ghi MIR. Tuy nhiên MIR 
chỉ được nạp trong chu kỳ con 1, chỉ bởi đường dứt nét từ mạch tạo 
xung clock đến MIR. 


16 , 

c 


decoder 


16. 

B 


decoder 


16. 

A 


decoder 


í 

t 

"í 




_-L _ 


3 Clock 


2 Subcycles 


256 X 32 Control Store 
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Hình 4.10 Sơ đồ khối đầy đủ của vi cấu trúc mẫu 
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16 registers : 16 thanh ghi cua bộ nhớ nháp 
c, B, A decoder : mạch giải mã cho c, B, A 
Subcycles : các chu kỳ con 
Clock : mạch tạo xung clock 
Increment : tăng 

256 X 32 control store : bộ nhớ điều khiển 256 từ 32-bit 
A latch : mạch chôt A 
B latch : mạch chốt B 
Shiíter : mạch dịch bit 

Micro, seq. Logic : mạch logic trình tự vi lệnh 

Trong 3 chu kỳ con còn lại MIR không bị ánh hưởng, khòng có 
gì xảy ra cho MPC. Trong chu kỳ con 2, MIR ổn định và các trường 
khác nhau bắt đẩu điều khiển đường dữ liệu. Hai trường A và B sẽ 
chọn các thanh ghi đê xuất nội dưng lên bus A và B. Các khôi giải 
mã A và B trong sơ đồ khôi nhận 4 bit của các trường A và B để 
tạo ra 16 đường cho mỗi khôi điều khiển các đường OEl và OE2 của 
các thanh ghi ( xem hình 4.2(b) ). Mạch tạo xung clock cũng tác 
động lên các mạch chốt A và B trong chu kỳ con này nhằm cung 
cấp các ngõ vào ổn định cho ALƯ trong các chu kỳ con kế. Trong 
khi dữ liệu đã được đưa lên bus A và bus B, đơn vị tăng của phần 
điều khiển tăng MPC lên 1 ( tính MPC + 1 ) nhằm chuẩn bị cho 
việc nạp vi lệnh kế trong chu kỳ kế. Bằng cách chồng chập 2 thao 
tác này, việc thực thi lệnh được tăng tốc độ. 

Trong chu kỳ con 3, ALU và mạch dịch bit được cung cấp thời 
gian đê tạo ra các kết quả có giá trị. Trường AMƯX của vi lệnh xác 
định ngõ vào bên trái của ALƯ ( hoặc từ bộ nhớ hoặc từ mạch chốt 
A ), ngõ vào bên phải luôn luôn lấy từ mạch chốt B. Mặc dù ALƯ là 
một mạch tố hợp, thời gian để tính tổng số được xác định bởi thời 
gian truyền số nhớ, không phải thời gian trì hoãn cổng thông 
thường. Thời gian truyền sô' nhớ tỉ lệ với sô" bit của từ. Trong khi 
ALU và mạch dịch bit đang tính toán, MAR được nạp từ bus B nếu 
trường MAR trong vi lệnh là 1. Trong chu kỳ con 4, phụ thuộc vào 
ENC và MBR, kết quả của ALƯ hoặc được chứa vào bộ nhớ nháp 
hoặc được chứa vào thanh ghi MBR. Mạch giải mã c có các ngõ vào 
nối với ENC, đường xung clock 4 và trường c của vi lệnh. Mạch này 
tạo ra 16 tín hiệu điều khiển, ơ bên trong, mạch này thực hiện việc 
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giải mã 4 -> 16 với 4 ngõ vào từ trường c rồi AND mỗi một ngõ ra 
với tín hiệu là kết quả của việc AND đường chu kỳ con 4 với ENC. 
Như vậy một thanh ghi của bộ nhđ nháp chỉ dược nạp khi 3 điều 
kiện sau thỏa : 

1. ENC = 1 

2. Tồn tại chu kỳ con 4 

3. Thanh ghi được chọn bởi trường c 

Thanh ghi MBR cũng được nạp trong chu kỳ con thứ tư nếu 
MBR = 1. 

Các trường RD và WR của thanh ghi MIR hoạt động như các 
mạch chốt, các tín hiệu điều khiển RD và WR được xác lập trong 
khi các trường RD và WR còn ở mức logic tích cực. 

4.2.4 Trình tự vi lệnh 

Đến đây, vấn đề duy nhất còn lại là cách thức chọn vi lệnh kê 
tiêp. Mặc dù thời gian chỉ đủ đê tìm nạp vi lệnh kế tiếp theo, cần 
phải có cơ chế nào đó cho phép nhảy có điều kiện ( conđitional 
jump ) trong vi chương trình để có thể tạo ra các quyết định. Do 
vậy, trong mỗi vi lệnh ta sè cung cấp 2 trường : ADDR là địa chỉ 
của vi lệnh kế tiếp và COND quyết định vi lệnh kế tiếp được tìm 
nạp từ MPC + 1 hay từ ADDR. Mọi vi lệnh đều có khá năng chứa 
một lệnh nhảy có điều kiện. Quyết định này có được do bơi lệnh 
nhảy có điều kiện được dùng rất phổ biến trong các vi chương trình 
và cho phép mọi vi lệnh có thể có 2 vi lệnh kế tiếp nhằm làm cho 
chúng chạy nhanh hơn so với trường hợp thiết lập một điều kiện 
nào đó trong vi lệnh và sau đó kiểm tra điều kiện này trong vi lệnh 
kế tiếp. Hầu hết các vi câu trúc hiện có sử dụng chiến lược này ờ 
dạng này hay dạng khác. 

Việc chọn vi lệnh kế tiếp được quyết định bởi khôi logic trình tự 
vi lệnh ( micro sequencing logic ) trong chu kỳ con 4, khi tín hiệu ra 
N và z của ALƯ có giá trị. Ngõ ra của khô'i này sẽ điều khiển mạch 
chọn kênh M ( Mmux ) đế đưa MPC + 1 hoặc ADDR tới MPC từ đó 
MPC trực tiếp tìm nạp vi lệnh kế tiếp. Vi lập trình viên có 4 khả 
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năng chọn lựa liên quan đến việc chọn vi lệnh kê tiêp. Khả nãng 
chọn lựa được cho biết bằng cách thiêt lập trường COND như sau : 

0 = không nhảy, vi lệnh kê tiêp được lây từ MPC + 1 

1 = nhảy tới ADDR nếu N = 1 

2 = nhảy tới ADDR nêu z = 1 

3 = nhảy vô điều kiện tới ADDR 

Khối logic trình tự vi lệnh kết hợp 2 bit N và z của ALƯ và 2 
bit COND, gọi chúng là L và R cho trái và phải, để tạo một tín hiệu 
ra. Tín hiệu chính xác là : 

Mmux = L RN + L R z + LR = RN Ht LZ + LR 

trong đó dấu + chỉ phép toán INCLUSIVE OR. Tín hiệu điều khiển 
tới Mmux là 1 ( dần đường cho ADDR đến MPC ) nêu LR là 0 I 2 và 
N = 1, hoặc LR là 10 2 và z = 1 hoặc LR là 11 2 . Ngược lại, nếu tín 
hiệu điều khiển tới Mmux là 0, vi lệnh kế tiếp theo được tìm nạp. 
Mạch tạo ra tín hiệu Mmux có thể được xây dựng từ các chip SSI 
hoặc là một phần của một dãy logic lập trình được PLA. 

Để làm cho vi cấu trúc mẫu gần với thực tế, ta sẽ giả thiết rằng 
chu kỳ bộ nhớ chính dài hơn chu kỳ vi lệnh. Nếu một vi lệnh bắt 
đầu việc đọc bộ nhớ chính bằng cách thiết lập RD là 1, RD cũng 
phải bằng 1 trong vi lệnh kế tiếp ( vi lệnh này có thể được hoặc 
không được định vị ở địa chỉ kế tiếp của bộ nhớ điều khiển ). Dữ 
liệu trở thành sử dụng được sau 2 vi lệnh kể từ khi khởi động việc 
đọc. Nếu vi chương trình không có điều gì khác để thực hiện trong 
vi lệnh theo sau tác vụ khởi động đọc bộ nhớ, vi lệnh chỉ có RD = 1 
và rõ ràng bị lảng phí. Cũng theo cách này, tác vụ ghi bộ nhớ cũng 
chiếm thời gian của 2 vi lệnh để công việc hoàn tất. 

4.3 MỘT CẤU TRÚC MACRO MAU 

Để tiếp tục thí dụ cho cấp vi lập trình, ta chuyển sang cấu trúc 
của cấp máy qui ước được hỗ trợ bởi trình phiên dịch chạy trên máy 
ở hình 4.10. Để thuận tiện, ta sẽ gọi cấu trúc của máy cấp 2 hoặc 
cấp 3 là câu trúc macro ( macroarchitecture ), tương phản với máy 
cấp 1, vi cấu trúc. ( Với mục đích của chương này ta sẽ bỏ qua máy 
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cấp 3 bởi vì các chỉ thị của cấp này phần lớn là các chỉ thị của máy 
cấp 2 và không có sự khác biệt quan trọng ớ đây ). Tương tự, các 
chỉ thị của máy câp 2 sẽ được gọi là các chỉ thị macro ( macro- 
instruction ). Do vậy trong chương này, các chỉ thị ADD, MOVE 
thông thường và những chỉ thị khác của cấp máy qui ước sẽ được 
gọi là chỉ thị macro. Chúng ta sẽ thỉnh thoáng đề cập đến máy cấp 
1 như Mic-1 và máy cấp 2 như Mac-1 trong thí dụ. Tuy nhiên, trước 
khi mô tả máy Mac-1, chúng ta sẻ đi hơi lạc đề một chút nhằm thúc 
đẩy việc làm rò sơ đồ thiết kế cũa máy này. 

4.3.1 stack 

Cấu trúc macro hiện đại được thiết kế với những yêu cầu cúa các 
ngôn ngữ cấp cao. Một trong những vấn đề thiết kẽ quan trọng 
nhất là định địa chỉ. Đế minh họa vấn đề phải giải quyết, hảy xét 
chương trình Pascal hình 4.11.(a). Chương trình chính ( có tên 
InnerProduct ) khởi động 2 vector X và y với các giá trị Xk - k và 
yk = 2k+l. Sau đó chương trình tính tích trong ( cũng gọi là tích 
điểm ) của 2 vector. Bât cứ khi nào cần nhản 2 số nguyên dương 
nhỏ, chương trình cũng đều gọi hàm pmuỉ ( hãy nghĩ rằng trình 
biên dịch là của máy vi tính và chỉ thực hiện một tập con của 
chương trình Pascal, không kế đến toán tử nhân ). 

Các ngôn ngữ có câu trúc khôi ( block-structured language ) như 
Pascal thường thực hiện theo phương pháp như vậy khi gọi một thú 
tục ( procedure ) hoặc gọi hàm í tunction ), bộ nhớ đang dùng cho 
các biến cục bộ được giãi phóng. Phương pháp dề nhât đê đạt được 
mục đích này là sử dụng một cấu trúc dữ liệu gọi là stack. Stack là 
một khôi liên tục của bộ nhớ dùng chứa dừ liệu nào đó, một con trò 
stack SP ( stack pointer ) cho biết đỉnh của stack đang ở đâu. Đáy 
của stack có địa chỉ cô" định và sè không liên quan đên chúng ta 
thêm nữa. Hình 4.12(a) mô tả một stack có 6 từ nhớ. Đáy của stack 
có địa chỉ là 4020 và đính của stack, vị trí mà SP trỏ tới, có địa chi 
là 4015. Các stack của chúng ta sẽ tăng từ địa chỉ cao đến địa chỉ 
thấp của bộ nhớ ( chọn ngược lại không làm cho kết quả thay đổi ). 

Vài thao tác được định nghĩa trên stack. Hai thao tác quan 
trọng nhất là PUSH X và POP Y. PUSH dẩy con trỏ stack SP lên 
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trên ( bằng cách giảm địa chỉ stack như trong thí dụ ) và sau đó đặt 
X vào bộ nhớ tại vị trí SP hiện trỏ tới. PUSH làm tăng kích thước 
của stack lên 1. Trái lại, POP Y làm giảm kích thước stack bằng 
cách cất phần tử trên đỉnh stack vào Y và sau đó loại bỏ phần tử 
này bằng cách tàng con trỏ stack một lượng bằng kích thước của 
phần tử được lây ra. Hình 4.12(b) trình bày cách chỉ thị PƯSH 5 
cất 5 vào stack. 

Một thao tác khác cũng được thực hiện trên stack là đẩy con trỏ 
stack lên trên nhưng thực sự không cất dừ liệu vào stack. Bình 
thường thao tác này được thực hiện khi đưa một thủ tục hoặc một 
hàm vào nhằm dành không gian dự trữ cho các biên cục bộ. Hình 
4.13(a) trình bày cách thức bộ nhớ được cấp phát trong khi thực 
hiện chương trình chính của hình 4.11. Chúng ta tùy ý giả thiết 
rằng bộ nhớ gồm có 4096 từ 16-bit, các từ ở địa chỉ từ 4021 tới 4095 
được hệ điều hành sử dụng ( không dùng để cất giữ các biến của 
chương trình ). Biến k cúa Pascal được cất ở địa chỉ 4020. ( địa chì 
được cho ở dạng số thập phân ), Dãy ( array ) X cần 20 từ ở địa chỉ 
từ 4000 tới 4019. Dãy y bắt đầu ở địa chỉ 3980 cho y[l] và mở rộng 
đến 3999 cho y[20|. Trong khi chương trình chính đang thực hiện 
bên ngoài hàm pmuỉ, SP có giá trị 3980 cho biết địa chỉ đỉnh của 
stack là 3980. 

Khi chương trình chính muốn gọi pmuỉ, trước tiên phải cất các 
tham số cúa chỉ thị gọi ( call ), 2 và k, vào stack, sau đó thực hiện 
chỉ thị gọi, chỉ thị này sẽ cất địa chỉ trở về vào stack để pmul biết 
nơi trở về khi công việc hoàn tất. Khi pmul bắt đầu thực hiện, SP 
trỏ tới dịa chỉ 3977. Điều đầu tiên pmul thực hiện là đẩy con trỏ 
stack lên 2, dành riêng 2 từ cho các biến cục bộ riêng của pmul : p 
và ỳ. Tại thời điểm này SP ờ địa chỉ 3975 như trình bày trong hình 
4.13(b). 5 từ trên đỉnh của stack tạo thành khung stack ( stack 
ửarne ) cho pmul sử dụng; chúng sê được giải phóng khi pmul kết 
thúc. Các từ ở 3979 và 3978 có tên là a và 6 bởi vì đây là nhừng 
tên của các biến hình thức của pmuỉ , dĩ nhiên, chúng sẽ chứa 2 và 
k. 

Khi prnuỉ trở về và thủ tục inner được gọi, cấu hình stack được 
trình bày như trong hình 4.13(c). 





program tnnerPmduct (output): 


{This program ìnitializes two vectos, X and y, of 20 elements each 
then computes their inner product: 

*tn * y[ 1] + x[2) * y[2] Jf[20) * y[20]> 


conts max - 20; 

{size of the vectors} 

type Smalllnt - 00..100; 

vec = array {!.. max> of Smalllnĩ; 


var kiinteger; 

X, y: vec; 



tunction pmul ịầ, b: SmalHnt): integer, 

{This tunction multiplies its parameters together and returns the product. 
!t pertorms the multiplication by repeated addition.} 
var p, Ị: integer, 


begln 

lf (a = 0 or (b =0) then 
pmut:= 0 

else 

begln 

p:= 0; 

for/:= 1 to a do 
p:=p+b ; 
pmui:=p; 

end 

end: {pmul> 

{0: reserve stack space tor p and ị } 

{1: if eĩther One is 0, result is 0} 

{2: tunctìon returns 0} 

{3: initialize p} 

{4: add b to p a times} 

{5; do the addition) 

{6: asssign result to íunction) 

{7: remove locals and return value} 


procedure inner (var v:vec; var ans: integer); 

{Compute the inner product of V and X and return it in ans.} 
var sum, i: irtteger; 


begln 

ăum:=0; 

for/:= 1 tomaxdo 
sum\= sum + pmul (*[/], V [/]); 
ans:= sum 
and :{/nner} 

{8: reserve stack space tor sum and /} 
{9: sum wilt accumuiate inner product} 
{10; toop through alt the elements} 

{11: accumulate one term} 

{12: copy resuỉt to ans } 

{13: remove sum and i and return} 

begin 

for k: = to max do 
begln 

y[kỊ:=pmu/ (2, k) + 1 

and 

inner (y, kị, 
writeln (kị 

and. 

{14: reserve space for k, X and ỵ) 

{15: initialization loop} 

{16: initializex} 

{17:initializeỵ} 

{18; cailinner > 

{19: print results} 


Hình 4.11(a) Chương trình tính tích trong bằng Pascal 
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K=4020 

/OEFINE SOME SYMBOLS 

INSP 

2 

/REMOVE PARAMS 

x=4000 


ADDL 

SUM 

/AC=SUM=PMUL(...) 

Y=3980 


STOL 

SUM 

/SUM:=SUM+PMÙL(...) 

A=4 


LOGO 

1 

/TEST AT END OF LOOP 

8=3 


ADDL 

1 

/AC=I+1 

P=1 


STOL 

1 

/1=1+1 

J=0 


SUBD 

C20 

/AC=I'MAX 

v=5 


JNEG 

L3 

/JUMP IF<MAX 

ANS=4 


JZER 

L3 

/JUMP IF=MAX 

SUM-1 


LODL 

SUM 

/12 

1=0 


PUSH 


/PUSH SUM 



LODL 

ANS 

/AC:=ADDRESS OF ANS 

JUMP MAIN 

/START AT MAIN PROGRAM 

POPI 


/ANS:=SUM 

PMUL: DESP 2 

/0 

INSP 

2 

/13 

LODL A 

/1 

RETN 


/RETURN 

JN2E ANOTZ 

/JUMP IPA <>0 




LOCO 0 

12 MAIN: 

DESP 

41 

/14 

JUMP DONE 

/RETURN 0 

LOGO 

1 

/15 

AN0T2: LODL B 

/AC:=B 

STOD 

K 

/K IS NOT A LOCAL 

JNZE BNOTZ 

/JUMPIFB<>0 L4: 

LODO 

K 

/16 

LOCO 0 

12 

PUSH 


/PUSH K ONTO STACK 

JUMP DONE 

/RETURN 0 

LO CO 

X-1 

/AC:= (ADORESS OF xp ])-1 

BNOT2: LOCO 0 

/3 

ADDD 

K 

/AC:=X+K-1 

STOL p 

/P:=0 

POPI 


/X[K]:=K 

LOCO 1 

/4 

LOCO 

2 

/17 

STOL J 

/J:=1 

PUSH 


/PREPARE PMUL(2,...) 

LODL A 

/CAN LOOP BE EXECUTEĐ? 

LODD 

K 

/PREPARE PMUL(2,K) 

JNEG L2 

/A<0. 00 NOT LOOP 

PUSH 


/BOTH PARAMS PUSHED 

JZER L2 

/A=0. DO NOT LOOP 

CALL 

P|RUL 

/PMUL(2.K) 

LI: LODL p 

/5 

INSP 

2 

/REMOVE PARAMETERS 

ADDL Đ 

/AC:=P+B 

ADDD 

C1 

/AC:=2*K+1 

STOL p 

/P:=P+B 

PUSH 


/PREPARE Y[KJ:=2*K+1 

LOCO 1 

/TEST AT END OF LOOP 

LOGO 

Y-1 

/AC:=(ADDRESS OF YỊIỊH 

ADDL J 

/AC:=J + 1 

ADDD 

K 

/AC:=Y=K-1 

STOL J 

/J:=J+1 

POPI 


/Y[KJ:=2*K+1 

SUBL A 

/AC: = J-A 

LOCO 

1 

/TÈST AT END OF LOOP 

JNEG LI 

/JUM IF J<A 

ADĐD 

K 

/AC:=K+1 

JZER LI 

/JUMP IF J=A 

STOD 

K 

/K:=K+1 

L2: LODL p 

/6 

SUBD 

C20 

/AC:=K-MAX 

DONE: INSP 2 

n 

JNEG 

L4 

/JUMP IF K<0 

HETN 

/RETURN 

JNER 

L4 

/JUMP IF K=MAX 



LOCO 

Y Y 

/18 

INNER: DESP 2 

/8 

PUSH 


/PUSH AODRESS OF Y 

LOCO 0 

/9 

LOCO 

K 

/AC:=ADDRESS OF K 

STOL SUM 

/SUM: = 0 

PUSH 


/PUSHIT ALSO 

LOCO t 

/10 

CALL 

INNER 

/PROCEDURE CALL 

STOL 1 

/I:=1 

INSP 

2 

/REMOVE PARAMS 

L3: LOCO X-1 

/11 

LOOD 

K 

/10 

ADDL 1 

/AC:=X+I-1 

PUSH 


PREARE WRIT£LN(K) 

PSHI 

/PUSH X[l] 

CALL 

OUTNUMi 

/UBRARY ROUTINÈ 

LODL V 

/AC:=ADÔRESS OF VECTOR 

INSP 

1 

/REMOVE PARAM 

ADDL 1 

/AC:=V+I 

CALL 

STOP 

/ENO OF JOB 

SUBD C1 

/V BEGINS AT 1.NOT 0 




PSHI 

/PUSHVỊI] C1: 

1 


/CONSTANT1 

CALL PUML 

/PUML (Xin.vpl) C20: 

20 


/CONSTANT 20 


Hình 4.11{b) ỉnnerProduct viết bằng ngôn ngừ hợp dịch 
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PC- 


SP—- 

4016 

4017 

4018 

4019 

4020 





PUSHS 




7 i 

9 

2 

8 

4 

5 


)PROGRAM 


) STACK 




(a) 



(b) 


Hình 4.12 (a) Stack (b) Stack sau khi cất 5 

Khi inner gọi pmul, stack được trình bày như trong hình 4.13(d). 
Đên đây có vấn đề xảy ra. Trình biên dịch sẽ tạo ra mã nào đê truy 
cập các tham số và các biến cục bộ của pmul ? Nếu trình biên dịch 
muôn đọc p bằng cách dùng một chỉ thị như MOVE 3976, SOME- 
WHERE, pmul sẽ làm việc khi được gọi từ chương trình chính 
nhưng sẽ không làm việc khi được gọi từ Ỉỉĩĩier. Tương tự, MO VE 
3971, SOMEWHERE, pmuỉ sẽ làm việc khi được gọi từ inner, 
nhưng không làm việc khi được gọi từ chương trình chính. 

Điều thực sự cần thiết là “ tìm nạp ở vị trí stack cao hơn vị trí 
con trỏ stack 1 từ ”. Nói cách khácv máy Mac-1 cần một kiểu định 
địa chì đề tìm nạp hoặc lưu ĩ từ ớ một khoảng cách tương đối đã 
biết so với con trỏ stack ( hoặc một kiêu định địa chi nào đó tương 
đương ). 
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stack 

trame 

for 

pmu/ 

Ị 


Stack 

frame 

fòr 

inner 

ỉ 



3975 

i 

—SP 3975 

1 



3976 

p 

3976 

sum 



3977 

ret.addr. 

3977 

ret.addr. 



3978 

b 

3978 

ans 



3979 

a 

3979 

v 1 

3980 

y(1) 

—SP 3980 

y[i] 

3980 

y[ij 


• 

* 

■ 


* 

* 

■ 


* 

a 

m 

3999 

y[20] 

Ị 3999 

y[20] 

3999 

y[20] 

4000 

x[1] 

4000 

x[1) 

4000 








4019 


4019 


4019 


4020 

k 

4020 

k 

4020 

k 

4095 


4095 


4095 



<a> (b) (c) 


stack 

frame 

for 



pmul 

3970 

1 

3971 

p 

3972 

ret.addr. 

3973 

b 

3974 

a 

3975 

1 

3976 

mtm 

3977 

ret.addr. 

3978 

ans 

3979 

V 

3980 

y[ij 


• 

• 

a 

3999 

ypo) 

4000 

x[11 



4019 


4020 

k 

4095 



(d) 


Hình 4.13. Bộ nhừ lức thời trong khi thực hiện chương trình ỉnnerProduct , 
(a). Stack trong khi thực hiện chương trình chính (b). Stack trong khi thực 
hiện hàm pmul. (c). Stack trong khi thực hiện thủ tục inner. (d). Stack 
trong khi thực hiện hàm pmuỉ ( được gọi từ thù tục inner ) 
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4.3.2 Tập chỉ thỉ macro 

Với kiêu định địa chi ở trên, chúng ta chuân bị xét đến câu trúc 
cua máy Mac-1, về cơ bản, Mac-1 gồm một bộ nhớ có 4096 từ 16-bit 
và 3 thanh ghi truy xuât được bới lập trình viên trẽn máy cấp 2. 
Các thanh ghi này là bộ đếm chương trình PC, con trỏ stack SP và 
bộ tích lũy AC ( accumulator ) được dùng đè chuyến dữ liệu, tính 
toán số học và cho những mục đích khác. Ba kiêu định địa chi được 
cung câp : trực tiêp, gián tiếp và cục bộ. Các chi thị dùng kiểu định 
địa chi trực tiếp chứa một địa chi bộ nhớ tuyệt đối 12-bit ớ 12 bit 
thấp. Những chi thị như vậy thường dùng đê truy xuất các biến 
toàn cục, như X trong hình 4.11. Kiêu định địa chì gián tiếp cho 
phép người lập trình tính toán địa chỉ bộ nhớ, đặt vào thanh ghi 
AC và sau đó đọc hoặc ghi từ đã được định địa chỉ. Dạng địa chỉ 
này rất phô biến và được dùng đê truy xuất các phần tử dãy, củng 
như các phần tứ khác. Định địa chi cục bộ cho biết một độ dời 
( offset ) từ SP và dùng dê truy xuât các biên cục bộ, như chúng la 
vừa thây. Ba kiểu định địa chí này cung cấp một hệ thông định địa 
chỉ tuy đơn giản nhưng đầy đù. 

Tập chi thị cứa máy Mac-1 được trình bày trong hình 4.14. Mồi 
chỉ thị chứa một mã thao tác { opcode ) và đôi khi chứa một địa chi 
bộ nhớ hoặc một hằng sô'. Cột đầu tiên cho biết mả nhị phản của 
chi thị. Cột thứ 2 cho mà gợi nhớ dạng hợp ngừ. Cột thứ 3 cho biêt 
tên chi thi và cột thứ 4 mô tá chi thị phải thực hiện thao tác gì 
bằng 1 đoạn các phát biếu trong Pascal. Trong các đoạn phát biếu 
này, m[xị chi từ nhớ X. Vì vậy LODD nạp vào thanh ghi tích lũy từ 
một từ nhớ được xác định trong 12 bít thấp cũa chì thị. Chỉ thị 
LODD có kiểu định dịa chi trực tiếp, trong khi LODL nạp vào AC 
từ nhớ ỡ khoáng cách X trên SP, vì thế có kiêu định địa chi cục bộ. 
Các lệnh LODD, STOD, ADDD và SƯBD thực hiện 4 chức năng cơ 
bản bằng cách dùng kiểu định địa chí trực tiẽp, còn LODL, STOL, 
ADDL và SƯBL cũng thực hiện các chức năng gióng như vậy nhưng 
dùng kiểu định địa chỉ cục bộ. 

Tập chỉ thị cũng cung câ'p 5 chỉ thị nhảy, một chỉ thị nhảy vô 
điều kiện t JƯMP ) và 4 chí thị nhảy có điều kiện ( JPOS, JZER, 
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JNEG và JNZE ). JUMP luôn luôn sao chép 12 bit thấp của chỉ thị 
vào bộ đêm chương trình, trong khi 4 chỉ thị kia cũng thực hiện 
cùng thao tác đó nhưng chỉ khi thỏa mãn mã điều kiện dã cho. 


Binary Mnemonlc Instructlon Meanlng 


OOOOxxxxxxxxxxxx 

LODD 

Load dlrect 

ac:-m[x) 

0001xxxxxxxxxxxx 

STOD 

Store dlrect 

m[jf]:=ac 

001Oxxxxxxxxxxxx 

ADDD 

Add dlrect 

ac:=ac+m [*] 

001Ixxxxxxxxxxxx 

SUBD 

Subtract direct 

ac:=ac-m [x] 

01OOxxxxxxxxxxxx 

JPOS 

Jump positive 

lf ac 2 0 then pc; =x 

OIOIxxxxxxxxxxxx 

JZER 

Jump zero 

lf acệ 0 then pc:=x 

0110XXXXXXXXXXXX 

JUMP 

Jump 

pc:=x 

Olllxxxxxxxxxxxx 

LOCO 

Load constant 

ac;=x (0ÍX-S4095) 

10OOxxxxxxxxxxxx 

LODL 

Load iocal 

ac;=m{sp+x] 

1001 xxxxxxxxxxxx 

STOL 

store local 

m[sp+x]:=ac 

1010XXXXXXXXXXXX 

ADỔL 

Add local 

ac:=ac+/n[sp+x] 

1011XXXXXXXXXXXX 

SUBL 

Subtract local 

ac;=ac-m[sp+x] 

110Oxxxxxxxxxxxx 

JNEG 

Jump negatlve 

lfac<0thenpc.=x 

1101 xxxxxxxxxxxx 

JNZE 

Jump nonzero 

ifac#Othenpc;=x 

1110XXXXXXXXXXXX 

CALL 

Call procedure 

sp:=sp-1,m[sp]:=pc;pc:=x 

1111000000000000 

PSHI 

Push Indirect 

sp:=sp-1;m[spj:=m[ac] 

1111001000000000 

POPI 

Pop indirect 

m[ac]; =m[8p];sp:-sp+1 

1111010000000000 

PUSH 

Push onto stack 

sp;=sp-1;m[sp]: =ac 

1111011000000000 

POP 

Pop from stack 

ac:=m[sp];sp:=sp+1 

1111100000000000 

RETN 

Return ị 

pc:=m[sp];sp:=sp +1 

1111101000000000 

SWAP 

Swap ac, sp 

tmp :=ac ;ac:= sp;sp:=tmp 

llimooyyyyyyyy 

INSP 

Increment sp ' 

* sp;=sp +y(0 £ y<255) 

11111110yyyyyyyy 

DESP 

Decrement sp 

sp: m sp-ỵ(0 í y 5 255) 


xxxxxxxxxxxx is a 12-bit machlne address; in column 4 it ís catied X. 
yyyyyyy ls an 8*blt constant; in column it is calíed y. 


Hình 4.14 Tập chỉ thị cúa Mac-1 

xxxxxxxxxxxx là địa chi máy 12 bít; trong cột 4 được gọi là X 
yyyyyyyy là hăng số 8-bit; trong cột 4 được gọi là y 
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Chỉ thị LOCO nạp một hằng số 12-bit trong tầm từ 0 đến 4095 
vào AC, PSHI cất vào stack từ nhớ có địa chỉ chứa trong AC. Thao 
tác ngược lại là POPI, lây một từ nhớ ra khỏi stack và cất vào từ 
nhớ có địa chỉ chứa trong AC. PƯSH và POP dùng để thao tác với 
stack theo nhiều cách khác nhau. SWAP trao đổi nội dung của AC 
và SP, được dùng khi SP phải tăng hoặc giảm một đại lượng chưa 
biết tại thời điểm biên dịch. Chỉ thị này cũng được dùng để khời 
động SP lúc bắt đầu thực hiện. INSP và DESP dùng để thay đổi SP 
một đại lượng đã biết tại thời điểm biên dịch. Do thiếu không gian 
mã hóa, nên các offset ở đây bị giới hạn là 8-bit. Cuối cùng chỉ thị 
CALL dùng để gọi một thủ tục, chỉ thị này cất địa chỉ trở về vào 
stack và chỉ thị RETN dùng để quay trở về từ thủ tục bằng cách lấy 
lại địa chỉ trở về và đưa vào PC. 

Cho đến đây, máy của chúng ta chưa có một chỉ thị xuất / nhập 
cũng như không có một phép cộng nào. Máy không cần nhừng chỉ 
thị đó. Thay vào đó, máy sẽ sử dụng I/O ánh xạ kiểu bộ nhớ 
( memory-mapped ĩ/0 ). Việc đọc từ địa chỉ 4092 sẽ sinh ra một từ 
16-bit với ký tự ASCII kế tiếp từ thiết bị nhập chuẩn trong 7 bit 
thấp và 9 bit cao là zero. Khi một ký tự có giá trị trong 4092, bit 
cao của thanh ghi trạng thái nhập, 4093, sẽ được thiết lập. Đọc địa 
chỉ 4092 sè xóa 4093. Chương trình nhập bình thường sẽ ồ trong 
một vòng lặp để chờ 4093 trở nên không xác lập. Khi đó chương 
trình nhập sẽ nạp AC từ 4092 và quay trở về. 

Chương trình xuất cùng được thực hiện theo sơ đồ tương tự. Việc 
ghi vào địa chí 4094 sẽ lấy 7 bit thấp của từ được ghi và sao chép 
chúng đến thiết bị xuất chuẩn. Bit cao của thanh ghi trạng thái 
xuất, từ 4095, lúc đó sè bị xóa, và thiết lập trở lại khi thiết bị xuất 
sản sàng nhận một ký tự mới. Thiết bị nhập và xuất chuẩn có thể 
là bàn phím và màn hình, hoặc đầu đọc thẻ và máy in hoặc một tổ 
hợp khác. 

‘Thí dụ về cách lập trình sử dụng tập chỉ thị này cho trong hình 
4.11(b). Đây là chương trình của hình 4.11.(a) được biên dịch thành 
hợp ngữ bởi một trình biên dịch, không có sự tối ưu hóa nào cả 
( mã tối ưu sẽ làm cho thí dụ khó theo dõi). Các số từ 0 tới 19 trong 
phần chú thích chỉ bởi một gạch chéo trong hợp ngữ nhằm mục 
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đích dễ dàng liên kết 2 nửa hình vẽ. OUTNƯM 1 và STOP là 
những thường trình thư viện thực hiện các hàm hiến nhiên. 

4.4 MỘT VI CHƯƠNG TRÌNH MAU 

Vi câu trúc và cấu trúc macro đã được khảo sát chi tiết, vấn đề 
còn lại là hiện thực. Chương trình sẽ thực hiện điều gì trên vi câu 
trúc và chương trình sẽ phiên dịch điều gì trẽn cấu trúc macro, và 
cách thức chương trình làm việc ? Trước khi trả lời những câu hỏi 
này, chúng ta phái xét kỹ xem sẽ dừng ngôn ngữ nào đê thực hiện 
vi lập trình. 

4.4.1 Vi hỢp ngừ 

Về nguyên tắc, ta có thê viết vi chương trình dưới dạng sô nhị 
phàn, mỗi vi lệnh dài 32 bit. Tuy nhiên chi có những người lập 
trình ờ cấp rất chuyên sâu mới quan tâm đến. Vì vậy, chúng ta cần 
một ngôn ngữ tượng trưng ( symbolic language ) đế diền tả các vi 
chương trình. Ký hiệu có thể thực hiện được là vi lập trình viên chỉ 
rò 1 vi lệnh cho 1 dòng, đặt tên cho từng trường khác zero và giá 
trị cúa trường. Thí dụ, đề cộng AC với A và chứa kết quả vào AC, ta 
có thể viết: 

ENC = 1 , c = 1 , B = 1, A = 10 

Nhiều ngôn ngữ vi lập trình thế hiện giống như vậy, tuy nhiên 
ký hiệu trên rất tôi nghĩa và các ngôn ngừ vi lập trình cũng vậy. 

Một ý tưởng tót hơn nhiều là sứ dụng ký hiệu của ngôn ngữ cấp 
cao, trong lúc vần giữ khái niệm cơ bản của dòng ký hiệu ban đầu 
cho mỗi vi lệnh. Người ta có thề viết các vi chương trình bằng các 
ngôn ngữ cấp cao thông thường, nhưng vì tính hiệu quả rất quan 
trọng trong vi chương trình, nên chúng ta sẽ dùng hợp ngữ, dược 
định nghĩa như là một ngôn ngừ tượng trưng có ánh xạ một-một 
trên các chí thị máy. Nên nhớ rằng tính hiệu quả của chương trình 
nếu bị giẩm 25 % sẽ làm toàn bộ máy cũng chạy chậm đi 25 %. Ta 
hãy gọi ngôn ngữ vi hợp ngữ cấp cao là “ MAL ” ( micro assembly 
language ), trong tiếng Pháp MAL có nghĩa là “ bệnh ”, nghĩa là 
bạn sẽ trở thành cái gì đó nếu bị bắt buộc viết quá nhiều vi chương 
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trình rác rối cho nlỉửng máy có phong cách riêng biệt. Trong ngón 
ngừ MAL, việc chứa vào 16 thanh ghi cua bộ nhớ nháp hoặc thanh 
ghi MAR và thanh ghi MBR được biếu thị bằng những phát 

biểu gán. Do vậy, thí dụ ờ trên trong ngôn ngữ MAL trở thành 

ac : = a + ac. { với ý định tạo ra ngôn ngữ MAL giống như Pascal, ta 

sẽ chấp nhận qui ước bình thường cua Pascal là dùng những 
tên nghiêng không viết hoa cho các ký hiệu nhận dạng 

f identiíĩer I ). 

Thí dụ, đề chì ra việc sử dụng các hàm 0, 1, 2 và 3 cùa ALƯ, ta 
có thê viết : 

ac := a + ac, a bandrir, smask), ac := a và a := inv(a) 

trong dó. band nghĩa là phép toán AND logic ( boolean and ) và inv 
nghĩa là nghịch dáo I invert ). Thao tác dịch bit có thè được ký hiệu 
bàng các hàm ishift cho dịch trái và rshiỷì cho dịch phái, như ; 

tir := lshift (tir + tir) 

phát biếu này đặt tir lẻn cá 2 bus A và B, thực hiện phép cộng, và 
dịch trái giá trị tống đi 1 bit sang trái trước khi cât trở lại vào tir. 

Chi thị nhảy vô điều kiện được điều khiến bàng phát biểu goto; 
các chí thị nhảy có điều kiện sẽ kiém tra n hoặc z, thí dụ : 

if n then goto 27 

Các phát biếu gán và chỉ thị nhảy có thể dược kêt hợp trên 
cùng một dòng. Tuy nhiên có một vân đề nhỏ phát sinh nêu ta 
muôn kiểm tra một thanh ghi nhưng không muôn cât dừ liệu vào 
đó. Làm sao ta có thề chi ra thanh ghi nào sẽ được kiềm tra ? Đê 
giải quyết vấn đề này, ta cần đưa ra 1 biên giả aỉu, biên này có thể 
được gán một giá trị chí đế cho biẽt nội dung của ALƯ. Thí dụ : 

aỉu := tir ; if n then goto 27 

nghĩa là tir đi qua ALƯ ( ALU code = 2 ) đế bit cao được kiểm tra. 
Lưu ý việc dùng biến alu có nghĩa là ENC = 0. 

Để chi ra các thao tác đọc và ghi bộ nhớ, ta chỉ phải đặt rd và 
wr vào chương trình nguồn. Theo nguyên tắc, trật tự của những 
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phần khác nhau cua phát biếu nguồn là tùy ý, nhưng để làm tăng 
khả năng đọc hiểu, ta sẽ sắp xếp chúng theo thứ tự chúng được thực 
hiện. Hình 4.15 cho một vài thí dụ về các phát biểu của ngôn ngữ 
MAL cùng với những vi lệnh tương ứng. 


Ạ c 

M o A M M E 

Ù N L s ỏ A R w N 

XDUHRRDRCCBA ADDR 


mar:-pc;rd 

0 

0 

2 

0 

0 

1 

1 

0 

0 

0 

0 

0 

00 

rd 

0 

0 

2 

0 

0 

0 

1 

0 

0 

0 

0 

0 

00 

lr:=mbr 

1 

0 

2 

0 

0 

0 

0 Ị 

0 

1 

3 

0 

0 

00 

pc:=pc + 1 

0 

0 

0 

0 

0 

0 

0 

0 

1 

0 

6 

0 

00 

mar:=lr, mbr:=ac; wr 

. 0 

0 

2 

0 

T 

I 

0 

1 

0 

0 

3 

1 

00 

alu:=tỉr;ì1n then goto 15 

0 

1 

2 

0 

0 

0 

0 

0 

0 

0 

0 

4 

15 

ac:=inv (rnbnị 

1 

0 

3 

0 , 

0 

0 

0 

0 

1 

1 

0 

0 

00 

tír:=Ishitì n then g oto 25 

0 

1 

2 

2 

0 

0 

0 

0 

1 

4 

0 

4 

25 

a/u;=ac,1fzthen goto22 

0 

2 

2 

0 

0 

0 

0 

0 

0 

0 1 

0 

1 

22 

ac: =band (lr, amask); goto 0 

0 

3 

1 

0 

0 

0 

0 

0 

1 

1 

8 

3 

00 

sp:=sp+(-1); rđ 

0 

0 

0 

0 

0 

0 

1 

0 

1 

2 

2 

7 

00 

tír:=lshttt (ir+/f); ifn then goto69 

0 

1 

0 

2 

0 

0 

0 

0 

1 

4 

3 

3 

69 


Hình 4.15 Một số phát biểu cùa MAL và các vi lệnh tương ứng 


4.4.2 Vi chương trình mẫu 

Cuô'i cùng, chúng ta đã đạt đến điểm có thế đặt tất gả các phần 
lại với nhau. Hình 4.16 là một vi chương trình chạy trên máy Mic-1 
và phiên dịch trên máy Mac-1. Đây là một chương trình ngắn, chỉ 
có 79 dòng. Lúc này việc chọn tên cho các thanh ghi của bộ nhớ 
nháp trong hình 4.8 đã rõ ràng : PC, AC và SP được dùng để giữ 3 
thanh ghi của Mac-1. IR là thanh ghi chỉ thị chứa nhừng chỉ thị 
macro hiện đang được thực hiện. TIR là bản sao tạm thời của IR, 
dùng để giải mà opcode. 3 thanh ghi kế tiếp lưu giữ nhừng hằng số 
đã chỉ định. AMASK là mặt nạ địa chỉ ( address mask ), 007777 
( cơ số 8 ), được dùng để phân biệt opcode và các bit địa chỉ. 
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dùng trong các chỉ thị INSP và DESP đế tách riêng offset 8-bit. 6 
thanh ghi còn lại không được ân định chức năng để người lập trình 
tùy ý sử dụng. 

Giông như tất cả các trình phiên dịch, vi chương trình hình 4.16 
có một vòng lặp chính để tìm nạp, giải mã và thực thi các chỉ thị từ 
chương trình được phiên dịch, trong trường hợp này là các chỉ thị 
cấp 2. Vòng lặp chính bắt đầu từ dòng 0, nơi bắt đầu tìm nạp chỉ 
thị macro ở thanh ghi PC. Trong lúc đợi chỉ thị, vi chương trình sẽ 
tăng PC và tiếp tục xác lập tín hiệu bus RD. Khi chi thị xuất hiện ớ 
dòng 2, chỉ thị được đưa vào IR và đồng thời bit cao ( bit 15 ) được 
kiểm tra. Nếu bit 15 là 1, việc giải mã tiến hành ở dòng 28, ngược 
lại, việc giải mã tiếp tục ở dòng 3. Giả sử lúc này chỉ thị là LODD, 
bit 14 được kiếm tra trên dòng 3 và TỈR được nạp với chỉ thị ban 
đầu đã dịch 2 bit sang trái, một dùng bộ cộng và một dùng mạch 
dịch bit. Chú ý là bít trạng thái N của ALƯ được xác định bởi ngõ 
ra của ALU; trong đó bit 14 là bit cao, bởi vì IR + IR dịch IR sang 
trái 1 bit. Ngõ ra của mạch dịch bit không làm ảnh hưởng đến các 
bit trạng thái của ALU. 

Cuối cùng, tất cả chỉ thị có 2 bit cao là 00 đến dòng 4 để bít 13 
được kiểm tra, với các chỉ thị bắt đầu là 000 dấn dòng 5 và những 
chỉ thị bắt đầu là 001 đến dòng 11. Dòng 5 là một thí dụ về vi lệnh 
có ENC = 0; chỉ kiếm tra TĨR mà không làm thay đổi giá trị. Tùy 
thuộc vào kết quẩ kiểm tra này, chương trình sè chọn LODD hoặc 
STOD. 

Đối với chỉ thị LODD, vi mã trước tiên phái tìm nạp từ nhớ 
được địa chỉ hóa trực tiếp bằng cách nạp 12 bit thấp của IR vào 
MAR. Trong trường hợp này 4 bit cao đều là zero nhưng đôi với 
STOD và những chỉ thị khác, chúng không bằng 0. Tuy vậy do MAR 
chi dài 12 bit nên các bit của opcode không ảnh hưởng đến sựvchọn 
lựa của việc đọc từ nhớ. Ở dòng 7, vi chương trinh không thực hiện 
điểu gì cả, chỉ có nhiệm vụ dợi. Khi từ nhớ xuâ't hiện, từ này được 
sao chép vào AC và vi chương trình nhảy tới đầu vòng lặp. Các chỉ 
thị STOD, ADDD, và SUBD cũng tương tự như vậy. Chỉ có đdểm 
đáng lưu ý liên quan đến chúng là làm thế nào để thực hiện phép 
t rừ. Vi chương trình sử dung sự kiện : 
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X - y = X + (-y ) = X'+(y+l) = X + ĩ + y 

trong phép bù 2. Phép cộng 1 với AC được thực hiện trên dòng 16, 
nếu không sẽ bị bỏ phí như dòng 13. 

Vi mã cho JPOS bắt đầu trén dòng 21. Nếu AC < 0, không rẽ 
nhánh và JPOS kết thúc ngay lập tức bằng cách nhảy trở về vòng 
lặp chính. Tuy nhiên, nếu AC > 0, 12 bit thấp của IR được lấy ra 
bằng cách AND chúng với mặt nạ 007777 và cất kết quả vào PC. 
Không phải tốn thêm bất kỳ vi lệnh nào nữa đế loại bỏ các bit 
opcode ớ đây, do vậy chúng ta có thế thực hiện tốt điều đó. Tuy 
nhiên, nếu tốn thêm một vi lệnh nữa, thì phải thật cẩn thận để 
xem có bit sai nào trong 4 bit cao của PC có thề gãy ra rắc rối sau 
này hay không ? 

JZER ( dòng 23 > làm việc trái ngược với JPOS. Với JPOS, nếu 
điều kiện được thỏa, không thực hiện nhảy và trá điều khiển về 
vòng lặp chính. Với chì thị JZER, nếu điều kiện thỏa , thao tác 
nhảy được thực hiện. Do mã của thao tác nhảy giống nhau cho tất 
cá chỉ thị nhảy nên đôi với các chi thị nhảy, ta có thể tiết kiệm vi 
mà bằng cách di tới dòng 22 bất cứ khi nào có thể. Kiểu lập trình 
này hay được xem là vụng về trong một chương trình ứng dụng, 
nhưng trong một vi chương trình không có thao tác nào bị ngán 
cản. Các chỉ thị JUMP và LOCO không phức tạp, do vậy chương 
trình thực thi được quan tâm kế tiếp dành cho LODL. Trước tién, 
địa chỉ tuyệt đô'i của bộ nhớ cần tham khảo được tính toán bằng 
cách cộng offset đã chứa trong chí thị với SP. Kế đến khởi động đọc 
bộ nhớ. Bới vì phần còn lại của mà giống nhau cho LODL và 
LODD, nên ta sẽ dùng dòng 7 và 8 cho cả 2 chỉ thị này. Việc tiết 
kiệm bộ nhớ điều khiển này không những không làm giám tốc dộ 
thực thi mà còn có nghĩa là ít chương trình phải sửa sai ( debug ) 
hơn. Mã tương tự được dùng cho STOL, ADDL và SƯBL. Mă cho 
JNEG và JNZE tương tự như JZER và JPOS. Chỉ thị CALL trước 
tiên giảm thanh ghi SP, sau đó đưa địa chỉ trở về vào stack và cuối 
cùng nhảy tới thủ tục. Dòng 49 gần như giống hệt dòng 22; và nếu 
chính xác giống nhau ta có thê bó dòng 49 bàng cách đưa một nhảy 
vô điều kiện đến dòng 22 vào trong dòng 48. 
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0: mar: =pc:rd; 

1 :pc:~pc+1:rd; 

2:ữ:=mbr;lt n then goto 28; 

3:tir:=lshift (ir+ir); H n then goto 19; 

4: tir:=lshift (tir); lf n then goto 11; 

5: aiu:=tír; ti n then goto 9; 

{main loop} 

(increment pc} 

{save, decode mbr} 

{000x or 001x7} 

{0000 or 00017} 

6: mar: =ir ế rd; 

7: rd; 

8: ac:=mbr; goto 0; 

{0000 = LODD} 

9: mar:=ir: mbr:=ac: wr; 

10: wr;goto 0; 

{0001= STOD} 

11 : alu:=tir:ii n then goto 15; 

{0010 or 00117} 

12: mar:=ir:rd; 

13: rơ; 

14: ac:=mbr+ac: goto 0; 

{0010 =ADDD} 

15: mar: =ịr:rd; 

16: ac =ac+1:rd; 

17: a:=inv (mbr); 

18: ac:=ac+a: goto 0; 

{0011 = SUBD} 

{Note:x - y= x+1 + not y} 

19: tir:=lshift (tir): ệf n then goto 25; 

20: alu:=tir: lf n then goto 23; 

{01 Ox or 011x?} 

{0100 or 01017} 

21: alu:=ac: ìt n then goto 0; 

22: pc:-banơ (ir, amas^l. goto 0; 

{0100 = JPOS} 

{pertorm the jump} 

23: a/u:=ac; tf z then goto 22; 

24: goto 0; 

{0101 = JZER} 

{jump tailed} 

25: alu: =tir: |f n then goto 27; 

26: pc:=banơ (ir, amàsk): goto 0; 

{0110 or 01117} 

{0110 = JUMP} 

27: ac:-band(ir, amask): goto 0; 

{0111 = LOCO} 

28: tìr:=lshift (ir+ir): lf n then goto 40; 

29: tir:=lshitt (tir): lf n then goto 35; 

30: alu:=tir: lf n then goto 33;. 

{lOxxor llxx?} 

{lOOxor 101x7} 

{1000 or 10017} 

31: a:=ir+sp; 

32: mar:=a:rd; goto 7; 

{1000 = LODL} 

33: a:=/r+sp; 

34: mar:=a:mbr:-ac:wr; goto 10; 

{1001 = STOL} 

35: alu:=tìr: if n then goto 38; 

{1010 or 10117} 

36: a:=/r+sp; 

37: mar:=a:rơ; goto 13; 

{1010 = ADDL} 

38: a:=ir+sp; 

39: mar:-a:rd; goto 16; 

{1011 = SUBL} 


Hình 4.16 Vi chương trình 
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40: tir.=ishitt (tir); tf n then goto 46; 
41: alu:=tír: II n then goto 44; 

42: alu:=ac: ư n then goto 22; 

43: goto 0; 

44: alw. =ac: lf z then goto 0; 

45: pc:=banơ ịir, amask): goto 0; 

46: tin =lshift (tir); It n then goto 50; 

47: $p:=sp + (-1) 

48: tnar. =sp;mbr: =pc; wr, 

49: pc:=band (ir, amask): wr; goto 0; 

50: tir:=lshift (tir); Un then goto 65; 
51: tir.=lshift (tir); Un then goto 59; 
52: a/u:=tir: II n then goto 56; 

53: mar:=ac;rd\ 

54: sp:=sp + (-1);rơ; 

55: mar:=sp;wr; goto 10; 

56: mar:=sp; sp:=sp+1; rd ; 

57: rơ; 

58: mar:=ac; wr; goto 10; 

59: alu: =tir; if n then goto 62; 

60: Sp:=sp+{-1) 

61: mar.=sp; mbr: = ac; wr; goto 10; 

62: rnar. =sp; sp:=sp+1; rd\ 

63; rd; 

64: ac;=mbr; goto 0; 

65: tir: =lshift (tir); if n then goto 73; 
66: a/u:=tir; lf n then goto 70; 

67: mar:=sp; sp:=sp+1; rd ; 

68: rơ; 

69: pc:=mfar; goto 0; 

70: a:= ac; 

71: ac:=sp; 

72: sp:=a; goto 0; 

73: alu : =tir; lf n then goto 76; 

74: a:= band (ir, smask); 

75: sp:= sp+à; goto 0; 

76: a:= band (ir, smask); 

77: a:= inv (a); 

78: a:= a+1; goto 75; 


{HOxorlllx?} 
{Iiooxor 1101?} 

{1100 = JNEG} 

{1101 = JNZE> 

{1110 = CALL} 

{1111, examine addr} 

{1111000=PSHI} 

{1111000=POPI> 

{1111010=PUSH} 
{1111011=POP} 


{1111100=RETN} 
{1111101 =SWAP} 

{1111110= INSP} 
{1111111=OESP> 


Hình 4,16 ( tiếp theo ) 
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Đáng tiếc là ta phải tiếp tục xác lập WR cho một vi lệnh khác. 
Phần còn lại là các chỉ thị macro có 4 bit cao là 1111, vì thê việc 
giải mã “ các bit địa chí ” được yêu cầu tách riêng. Các chương trình 
thực thi thực tê không quá khó do vậy chúng ta sẽ không đề cập 
thêm về chúng ở đây. 

4.4.3 Các lưu ý vể vi chương trình 

vẫn còn một vài điểm đáng lưu ý mặc dù chúng ta đã thảo luận 
chi tiết về vi chương trình. Trong hình 4.16 ta tăng PC trong dòng 
1. Điều này cũng được thực hiện ớ dòng 0, vì vậy dòng 1 được giải 
phóng cho công việc khác trong lúc đợi. Trong máy thí dụ ở đây 
không có gì để làm nhưng ở các máy thực tế, vi chương trình có thề 
lợi dụng cơ hội này đê kiểm tra các thiết bị I/O đang chờ phục vụ, 
làm tươi RAM động, hoặc thực thi một công việc khác. 

Nếu ta đế mặc dòng 1 theo như cách đã có, ta có thể tăng tốc độ 
của máy lẽn bằng cách sửa dòng 8 thành : 

mar := pc ; ac := mbr ; rd ; goto 1 ; 

Nói cách khác, ta có thề bắt đầu tìm nạp chỉ thị kế tiếp trước 
khi chỉ thị hiện tại thực sự hoàn tất. Khả năng này cung cấp dạng 
ban đầu cho việc tạo đường ống cho chỉ thị ( instruction pipelining ). 
Cách này có thể được áp dụng cho các chương trình thực thi khác. 

Rõ ràng một lượng quan trọng thời gian thực thi của từng chỉ 
thị macro được dành cho việc giải mã chỉ thị theo từng bít. Nhận 
xét này cho thấy rất có lợi khi có thể nạp MPC dưới sự diều khiển 
của vi chương trình. Trên nhiều máy tính hiện nay, vi câu trúc có 
phần cứng hỗ trợ cho việc lấy ra các opcode của chỉ thị macro và 
đưa trực tiếp chúng vào MPC để mang lại một -rẽ nhánh nhiều 
đường. Thí dụ, nếu ta có dịch phải IR 9 bit, xóa 9 bit cao và cất kết 
quả vào MPC, ta sẽ có một nhánh 128 dường với các vị trí từ 0 tới 
127. Mỗi từ trong đó sẽ chứa vi lệnh đầu tiên cho chỉ thị macro 
tương ứng. Mặc dù phương pháp này làm lãng phí bộ nhớ điều 
khiển, nhưng lại làm táng đáng kể tốc độ máy, vì thế một số 
phương pháp giống như vậy vần luôn được dùng trong thực tế. 

Chúng ta đã không nói gì đến cách các thiết bị I/O được hiện 
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thực, và chúng ta cũng không cần đề cập. Bằng cách dùng phép ánh 
xạ bộ nhớ, CPU không biết được sự khác nhau giữa địa chỉ bộ nhớ 
thực và các thanh ghi của thiết bị I/O. Vi chương trình điều khiển 
các thao tác đọc và ghi với 4 từ trên cùng của không gian địa chỉ 
theo cùng cách của bất kỳ một thao tác đọc và ghi nào khác. 

4.4.3 Triển vọng 

Vậy thì vi lập trình là gì ? Ý tưởng cơ bẩn cần bắt đầu với một 
phần cứng đơn gián ( hardware machine ). Trong thí dụ của chúng 
ta, phần cứng có ít hơn 22 thanh ghi, 1 ROM nhỏ cho bộ nhớ điều 
khiển, 1 mạch cộng, 1 mạch tăng, 1 mạch dịch bit và một mạch tổ 
hợp dùng đề chọn kênh, giải mã và tạo trình tự cho vi lệnh. Dùng 
phần cứng này ta có thể xây dựng một phần mềm phiên dịch để 
thực thi các chỉ thị của một máy cấp 2. Với sự giúp đỡ của một 
trình biên dịch, ta có thể dịch các chương trình ngôn ngữ cấp cao 
thành các chỉ thị cấp 2 và sau đó phiên dịch tuần tự các chỉ thị 
này. 

Như vậy để chạy một chương trình viết bằng một ngôn ngữ cấp 
cao, trước tiên ta phải dịch chương trình này sang cấp 2, sau dó 
phiên dịch các chỉ thị cấp 2 này. Cấp 2 phục vụ có hiệu quả như là 
một giao tiếp giữa trình biên dịch và trình phiên dịch. Mặc dù theo 
nguyên tắc, trình biên dịch có thề trực tiếp tạo ra vi mã, nhưng nếu 
thực hiện như vậy sẽ phức tạp và tốn nhiều bộ nhớ. Mỗi một chỉ thị 
macro chiếm một từ 16-bit, trong khi vi mả tương ứng, loại trừ logic 
giải mã chỉ thị, tính trung bình sẽ cần khoảng 4 vi lệnh 32-bit. Nếu 
biên dịch trực tiếp sang câp 1, bộ nhớ tổng cộng cần thiết sẽ tăng 
lên khoảng 8 lần. Hơn nừa, nhu cầu gia tăng bộ nhớ sè làm tăng bộ 
nhớ điều khiển, thường tôn. kém hơn rất nhiều do tốc độ cao của bộ 
nhớ này. Dùng bộ nhớ chính đê chứa các vi mã là điều không mong 
muốn bởi vì điều này làm giảm tốc độ máy. 

Qua những thí dụ cụ thế này, ta đã rỏ tại sao các máy tính hiện 
nay thường được thiết kế như là một chuỗi các cấp máy. Tính hiệu 
quả và tính đơn giản đạt được theo thiết kế này vì mỗi một cấp 
máy xử lý một cấp trừu tượng khác nhau. Người thiết kế cấp máy 0 
lo lắng về cách làm thế nào để lấy vài nanosec cuối cùng của ALƯ 
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bằng cách dùng một giải thuật mới để làm giám thời gian truyền sô 
nhớ ( carry-propagation ). Vi lập trình viên lo lắng về cách làm thế 
nào nhận được nhiều thuận lợi nhất trong từng vi lệnh, điển hình 
là lợi dụng nhiều càng tôt cơ chê song song vốn có của phần cứng. 
Người thiết kế tập chỉ thị macro lo lắng về cách làm thế nào để 
cung cấp một giao tiếp mà cá người viết trình biên dịch và vi lập 
trình viên đều có thế học dễ dàng và đồng thời cũng có hiệu quả. 
Rõ ràng mỗi cấp đều có nhửng mục tiêu, những vấn đề, nhừng kỹ 
thuật khác nhau và một cách tống quát, có một phương pháp xem 
xét khác nhau. Bằng cách chia toàn bộ vấn đề thiẽt kế máy thành 
nhiều vấn dề nhỏ, ta có thể nắm vững dược những vấn đề phức tạp 
vốn có trong việc thiết kê một máy tính hiện nay. 

4.5 THIẾT KÊ Ở CẤP VI LẬP TRÌNH 

Giống như mọi vấn đề khác trong ngành khoa học máy tính, 
việc thiết kế vi cã'u trúc hoàn toàn là những thóa hiệp. Trong các 
phần sau chúng ta sẽ xem xét một sô' vấn đề về thiết kế và những 
thỏa hiệp tương ứng. 

4.5.1 Vi lập trình dọc và ngang 

Có lẽ sự thỏa hiệp chính là có bao nhiêu sự mã hóa dược đặt 
trong các vi lệnh. Nếu người ta đã xây dựng máy Mic-1 bằng một 
chip VLSI, người ta có thể bỏ qua các khái niệm trừu tượng như là 
các thanh ghi, ALU và v.v... , chỉ xét đèn các cống. Để một máy tính 
hoạt động, cần có một sô tín hiệu như 16 tín hiệu OE để đưa nội 
dung các thanh ghi lên bus A và các tín hiệu điều khiền chức nàng 
của ALƯ. Khi thiết kế ALƯ cho thí dụ hình 4.8 với 2 đường điểu 
khiển F0 và Fl, thực sự mạch bên trong ALƯ được điều khiên bời 4 
đường tín hiệu cho 4 chức năng nhờ vào một mạch giải mã 2 -> 4. 
Tóm lại, mỗi máy đều có một tập n tín hiệu điều khiến đưa đên các 
nơi thích hợp để làm cho máy hoạt động, không cần bất kỳ sự giải 
mã nào. 

Quan điểm này dần đến một khuôn dạng vi lệnh khác : vi lệnh 
có độ rộng n bit, mỗi bit ứng với một tín hiệu điều khiển. Các vi 
lệnh rtƠIIVPTI tắc nàv đươc gọi là ngang ( horizontal ) 
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và tạo ra một thái cực của một loạt các khả năng. Thái cực kia ỉà 
những vi lệnh với một sô ít vùng được mã hóa. Những vùng này 
được gọi là dọc ( vertical ). Các tên này xuât phát từ cách mà một 
họa sĩ phác họa các bộ nhớ điều khiển tương ứng : các thiết kế 
ngang có một sô' tương đôi ít các vi lệnh rộng ; các thiết kế dọc có 
nhiều vi lệnh hẹp. 

Giữa 2 thái cực này có nhiều thiết kê pha trộn, Thí dụ các vi 
lệnh của chúng ta có một sô bít như là MAR, MBR, RD, WR, và 
AMƯX trực tiếp điều khiển các chức năng phần cứng. Mặt khác, các 
trường A, B, c và ALƯ cần một mạch logic giải mã trước khi có thể 
dưa chúng tới các cống riẽng biệt. Một vi lệnh cực dọc ( extreme 
vertical ) chỉ có một opcode, hiếm khi là một khái quát của trường 
ALU và một sô toán hạng như các trường A, B, và c. Trong một tổ 
chức như vậy, các opcode được cần cho việc đọc và ghi bộ nhớ chính, 
tạo ra các vi lệnh nhảy ( microjump ) và v.v..., bới vì các trường điều 
khiển các chức năng này trong máy của chúng ta sẽ không còn xuất 
hiện nữa. 

Đê phân biệt rõ hơn giữa vi lệnh dọc và ngang, ta hây thiết kế 
lại vi cấu trúc mầu của chúng ta sử dụng các vi lệnh dọc, Mỗi một 
vi lệnh sẽ có 3 trường 4-bit, tống cộng là 12 bit so với phiên bản 
gôc là 32 bit. Trường đầu tiên là opcode, OP, cho biết vi lệnh sè 
thực hiện điều gì. 2 vùng kế tiếp là 2 trường thanh ghi RI và R2. 
Đề thực hiện thao tác nhảy, hai trường thanh ghi được kết hợp để 
hình thành một trường 8-bit, R. Vi lệnh tiêu biểu là ADD SP, AC 
nghĩa là cộng AC với SP. 

Danh sách đầy đú các opcode của vi lệnh cho máy mới này, ta 
gọi là Mic-2, được cho trong hình 4.17. Từ danh sách ta thấy rõ 
rằng mỗi vi lệnh chỉ thực hiện một chức năng : nếu thực hiện phép 
cộng, sẽ không thế dịch, không thế nạp MAR hoặc ngay cả giữ cho 
RD xác lập. Chỉ với 12 bit trong vi lệnh, ta chỉ đủ chỗ để chỉ rõ một 
thao tác. 

Bây giờ chúng ta phải sửa lại hình 4.10 để phản ánh những vi 
lệnh mới. Sơ đồ khối mới được cho trong hình 4,18. Phần đường dữ 
liệu bên trái giống với sơ đồ cũ. Hầu hết phần điều khiển ở bên 
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phải cũng được duy trì giống như cũ. Ta vẫn cần MIR và bộ nhớ 
điều khiển ( mặc dù các từ mới chỉ rộng 12 bit thay vì 32 bit ). Kích 
thước và các chức năng cứa MPC, Mmux, mạch tăng, mạch tạo xung 
clock , và mạch logic trình tự vi lệnh đều giống với kích thước và 
chức nảng trong sơ đồ thiết kê ngang. Hơn nữa, chúng ta cần các 
mạch giải mã 4 -> 16 cho các trường Rl và R2, tương tự như các 
mạch giải mã cho các trường A, B và c trong hình 4.10. 

Có 3 điểm khác nhau chính giữa hình 4.10 và hình 4.18 là các 
khối có tên AND, NZ và giải mã OP. cần dùng thêm khôi AND vì 
trường RI bây giờ điều khiển cả 2 bus A và bus c. Một vấn đề nữa 
phát sinh do bới bus A được nạp trong chu kỳ con 2 nhưng bus c 
không thê được nạp vào bộ nhớ nháp cho đến khi các mạch chốt A 
và B ổn định, trong chu kỳ con 3. 


Blnary Mnemonlc tnstructlon Meanlng 


0000 

ADD 

Addltlon 

r1:=r1+r2 

0001 

AND 

Boolean AND 

r1:=r1 AND r2 

0010 

MOVE 

Move reglster 

r1:=r2 

0011 

COMPL 

Complement 

rí:=lnv ự2) 

0100 

LSHIPT 

Lett shlft 

r1:-lshftt (f2) 

0101 

RSHIPT 

Right shitt 

r1:=rshlft (r2) 

0110 

GETMBR 

Store MBR In register 

r1:=mbr 

0111 

TEST 

Test reglster 

if r2<0thenn:=true;lf r2=0 then z:=true 

1000 

BEGRD 

Begín read 

mar:=r1; rơ 

1001 

BEGWR 

Begin write 

mar:=r1; mbr:=r2; wr 

1010 

CONRD 

Contínue read 

rổ 

1011 

CONWR 

Contlnue write 

wr 

1100 


(not used) 


1101 

NJUMP 

Jump lf N=1 

Itnthen gotor 

1110 

ZJUMP 

Jump lf Z=1 

»f 2 then goto r 

1111 

UJUMP 

Uncondttlonal Jump 

goto r 


r=16*r1+r2 


Hình 4.17 Các opcode của Mic-2 
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Cấu trúc Máy tính 


Binary : nhị phân Mnemonic : ký hiệu gợi nhớ 

Instruction : chi thị Meaning : ý nghĩa 

Ađđition : cộng Booloan AND : AND logic 

Move rcgister : di chuyên thanh ghi 

Complrmont : lây bù Left shift : dịch trái 

Uight shiỉt : dịch phai Test register : kiểm tra thanh ghi 

Store MBR in rogisler : chứa MBR vào thanh ghi 

Begin read : bất dầu đọc Begin write : bắt đầu ghi 

Continue read : tiêp tục đọc Continue write : tiêp tục ghi 

( nut used ) : không dùng Jump if N = 1 : nháy nếu N = 1 

Jump if z = 1 : nhay nếu z = 1 

Uncundilional jump : nhay không điều kiện 

Khối AND thực hiện AND 16 tín hiệu giải mã với cả 2 đường : 
đường chu kỳ con 4 từ mạch tạo xung clock và tín hiệu đên từ khối 
giải mã OP ( tín hiệu này tương đương với tín hiệu ENC trước đây ). 
Kết qua là 16 tín hiệu nạp dữ liệu vào bộ nhớ nháp được xác lập 
dưới cùng các diêu kiện như trước đây. 

Khôi NZ la 1 thanh ghi 2-bit được dùng để chứa 2 tín hiệu N và 
z của ALU Chúng ta cần tiện ích này vì trong thiết kế mới ALƯ sẽ 
phải thực hiện cong việc trong 1 vi lệnh nhưng các bit trạng thái sẽ 
không được kiếm tra cho tới khi có vi lệnh kế tiếp. Vì ALU không 
có bộ nhớ cục bọ còn các tín hiệu N và z có được từ kết quả hiện 
tại, N là bit cao còn z là kết quả việc NOR tất cả các bit của kêt 
quá, nên ca 2 tín hiệu trạng thái này sẽ bị mất sau vi lệnh nếu 
chúng không được chốt vào một nơi nào đó. 

Phân tứ chính trong vi cấu trúc mới là khối giải mã OP. Khối 
này lấy tín hiệu từ trường OPCODE 4-bit để tạo ra các tín hiệu điều 
khiến khối AND, mạch logic trình tự vi lệnh, NZ, Amux, ALƯ, 
mạch dịch bit, MBR, MAR, RD và WR. Các mạch logic trình tự vi 
lệnh, ALƯ và mạch dịch bit đều cần có 2 tín hiệu giống như trong 
thiết kế trước. Khôi giải mã OP tạo ra 13 tín hiệu riêng biệt dựa 
trên 4 bit cao của vi lệnh hiện tại. 

Với mồi opcode trong 16 opcode của vi lệnh, người thiết kế máy 
phải quyết định tín hiệu nào được xác lập và tín hiệu nào không 
xác lập trong 13 tín hiệu bắt nguồn từ khối giải má OP. 




Chương 4: Cấp vi lập trình 
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] Shĩìtter 

ii 


16 

reglsters 


256x12 

Control 

store 


RI 

decoder 


R2 

decoder 


3 Clock 


2 Subcycles 


OP 

Oecode 


RD< 

WR. 


■II 


Hình 4.18 Vi cấu trúc với các vì lệnh đọc 

Rl decoder : mạch giái mã Rl 
R2 decoder : mạch giái mã R2 
Clock : Mạch tạo xung clock 
Subcycles : các chu kỳ con 
Increment : tăng 

Control store : bộ nhớ điều khiến 

Micro seq. Logic : mạch logic trình tự vi lệnh 

OP decode : khôi giải mã OP 

Shiíter : mạch dịch bit 

A, B latch : mạch chốt A, B 

16 registers : 16 thanh ghi 
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Cấu trúc Máy tính 


Thực tế, ma trận nhị phản 16 X 13 cung câp giá trị cho mỗi 
đường điều khiển đối với từng opcode phải được tạo ra. Ma trận của 
máy Mic-2 cho trong hình 4-19. Các cột được gắn với các tên của tín 
hiệu. Các hậu tô L và H nghĩa là thấp ( low ) và cao ( high ), và chỉ 
áp dụng cho các thành phần có 2 đường điều khiển : ALƯ, mạch 
dịch bit và mạch logic trình tự vi lệnh. 


Controt llnes 


ALUL SHL AMUX MẠX RD MSLH 

Mlcrolnstructlon Ị i 1 1 I 

opcode ALUH ị SHH Ị nz | and ị MBR ị WR ị MSLL 


0 

ADD 





+ 


+ 







1 

AND 


+ 



+ 


+ 







2 

MOVE 

+ 




+ 


+ 







3 

COMPL 

+ 

+ 





+ 







4 

LSHIFT 

+ 


+ 


+ 


+ 


- 





5 

RSHirr 

+ 



+ 

+ 


+ 







6 

GETTMBR 

+ 




+ 

+ 

+ 







7 

TEST 

+ 




+ 









8 

BEGRD 

+ 







+ 


+ 




9 

BEGVVR 

+ 







+ 

+ 


+ 



10 

CONRD 

+ 









+ 




11 

CONVVR 

+ 










+ 



12 















13 

NJUMP 

+ 












+ 

14 

ZJUMP 

+ 











+ 


15 

UJUMP 

+ ! 











+ 

+ 


Hình 4.19 Các tín hiệu điều khiến cho từng opcode của vi lệnh. Dấu + có 
nghĩa là tín hiệu được xác lập; khoảng trống nghĩa là tín hiệu không xác 

lập. 

Microinstruction opcode : opcode của vi lệnh 
Con troi lines : các dường điều khiến 






































Chương 4: Câp vi lập trình 
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Xét một thí dụ về opcode của vi lệnh qua chỉ thị khới động việc 
dọc bộ nhớ, BEGRD. Chỉ thị dùng hàm thứ 2 của ALU ( chọn bus 
A ), do vậy ALƯH = 1 và ALƯL = 0. Chỉ thị cũng chốt MAR và xác 
lập RD. Tất cả các tín hiệu điều khiển khác đều không xác lập. Bây 
giờ hãy xét đến các chỉ thị nhảy. Do đả quyết định tương thích với 
mạch logic trình tự vi lệnh trong thiết kế cũ, nên ta cần cặp tín 
hiệu MSHL MSLL là 00 cho thao tác không nhảy, 01 cho nhảy có 
điều kiện N, 10 cho nhảy có điều kiện z và 11 cho nhảy vô điều 
kiện. ( tính tương thích đã đạt đến qui mô lan rộng trong ngành 
công nghiệp máy tính và ngay cá các máy có tính giả thuyết trong 
những sách giáo khoa hiện nay cũng có tính tương thích với những 
máy tiền nhiệm ). Chỉ thị NƠUMP tạo ra 01, chỉ thị ZJƯMP tạo ra 
10 và chỉ thị ƯJUMP tạo ra 11. Tất cả các opcode khác tạo ra 00. 

Bây giờ đến phần thú vị : làm thế nào đé xây dựng được một 
mạch có 4 đường nhập ( 4 bit của opcode ) và 13 đường xuất ( 13 tín 
hiệu điều khiển ), mạch này tạo ra hàm trong hình 4.19 ? Câu trả 
lời là : dùng 1 hoặc nhiều PLA ( hoặc ROM ). Hình 4.19 thực sự là 
một phương pháp hơi đặc biệt đê biêu thị 13 báng sự thật 4-biến, 
mỗi bảng cho một cột, với sỏ hàng hoàn toàn có thể xác định các 
giá trị của 4 biến. Vậy thì câu hòi về cách thức xây dựng mạch 
giảm thành câu hỏi về cách thức hiện thực một bảng sự thật. Cách 
tốt nhâ't là dùng 1 PLA có 4 ngõ vào và 13 ngỏ ra. Nếu không có, 
có thể dùng 3 PLA 74LS330 12 ngõ vào và 6 ngõ ra. Nếu ta gán cho 
4 bit của opcode là A, B, c và D, từ cao tới thấp, một số tín hiệu 
ngõ ra là : 

ALUL = Ã B CD + Ã BCD = Ã BD 
AHH = ÃB c ĩ) 

MAR = ABCD + ABCD = ABC 
MSLH = ABC ĩ) + ABCD = ABC 
Chỉ có 15 số hạng tích được tạo ra vì AB c Ẽ) không xảy ra. 

Với phần cứng hoàn tất được thiết kế lại, ta cần viết lại vi 
chương trình. Vi chương trình này được cho trong hình 4.20. 
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0 

: mar:=pc;rd'. 

23: 

1 

: rd . 



pc:=pc+1; 

24: 

2 

; ir:=mbr, 



tír:=lshitt ( ừ ); 

25: 


if n then goto 28; 


3 

tir:=lshift (ịif); 

26: 


if n then goto 19; 


4 

tir:-lshift (từ); 



lf n then goto 11; 


5 

alu:=tir, 

27: 


ỉl n then goto 09; 


6 

mar=ir; rd; { LODD > 


7 

rd\ 

28: 

8 

ac:=mbr\ 



goto 0; 

29: 

9 

: mar:=ir; mbr:=ac; m; {STOD} 

30: 

10 

: wr, 


goto 0; 


11; 

: alu:=tìr. 

31: 


Itn then goto 15; 


12 

mar:=ir; rd; {ADDD) 

32: 

13 

rờ; 


14 

a:=mbr ; 



ac:=ac+a; 



goto 0; 

33: 

15: 

mar:=ir; rd; {SUBD) 


16: 

rd\ 

34: 

99: 

ac:~ac+ 1; 


17: 

a:=mbr\ 



a:=inv (a); 


18: 

ac:=ac+a; 

35: 


goto 0; 


19: 

tir:=lshift (tì ĩ); 



tf n then goto 25; 

36: 

20: 

alu:=tir\ 



ff n then goto 23; 

37: 


21: a/u;=ac; {JPOS> 

if n then goto 0; 

22: pc:=T-; 

pc:=band (pc, amask) ; 

goto 0; 


Cấu trúc Máy tính 


alu:=ac: {JZER> 
lf z then goto 22; 
goto 0; 

aíu:=tír, 

H n then goto 27; 

pc:=ir; {JUMP} 

pc:=band ịpc, amasky 

goto 0; 

ac:-ir; {LOCO} 
ac:=band (ầc , amasky 

goto 0; 

tir:=t$hift (tir); 

if n then goto 40; 

tir:=lshiít ịtir); 

lf n then goto 35; 

alu:=tìr, 

If n then goto 33; 

a:=ỉr; {LODL} 
a:=a+sp; 
mar:=a; rd, 
rd; 

ac:= mbr, 

goto 0; 

a:=ir; {STOL> 
a:=a+sp; 

mar:=a; mbr:= ac; wr, 

wr; 

goto 0; 

alu:= rir, 

if n then goto 38; 

a:=ir; {ADDL} 
a:=a+sp; 
mar: =a; rd, 
rd\ 

a:= mbr, 
ac:= ac+a; 

goto 0; 


Hình 4.20 Vi chương trình cho Mic-2 







30: a:+/r.{SUBL> 
a:=a+sp; 

39: mar:=a; rd\ 
rd ; 

goto 99; 

40: tir:=lshift (tir); 

if n then goto 46; 

41: alu:=tir, 

lf n then goto 44; 

42: a/u: =ac;{JNEG> 

lf n then goto 22; 

43: goto 0; 

44: a/u:=ac;{JNZE} 

It z then goto 0; 

45; pc:=ir; 

pc:=band (pc, amask)\ 

goto 0; 

46: tír:=lshift (tir)\ 

K n then goto 50; 

47: sp;=sp+(-t); {CALL} 
48: mar:=sp; mbr:=pc;wr, 
wr\ 

49: pc:-ir, 

pc:=band (pc, amasck ); 

goto 0; 

50: tir:=lshìft (tir) -, 

if n then goto 65; 

51: tir:=lshift (tíry, 

!f n then goto 59; 

52: alu:=tir; 

lf rt then goto 56; 

53: mar:=ac; rd; {PSHI) 

rd\ 

54: sp.'=sp+(-1); 

55: a:=mbr; 

mar:=sp; mbr:=a; wr\ 
wr; 

goto 0; 

56: mar:=sp; rd; {POP\} 

57: rd\ 

sp:=sp+1; 


58: a:=mbr, 

mar:=ac; mbr:=wr\ 
wr 

goto 0; 

59: alu:=tir, 

lf n then goto 62: 

60: sp:=sp+(-1):{PUSH>; 
61: rnar: =sp, mbr: = ac; wr\ 
wr, 

goto 0; 

62: mar:—sp; rd; {POP} 

63: rd\ 

sp.*=sp+1; 

64: ac:= mbr; 

goto 0; 

65: tir:=lshift (tir) ’, 

lf n then goto 73; 

66: alu:=tír, 

lf n then goto 70; 

67: ỉTìar: = sp; rd; { RETN } 
68: rơ. 

sp:=sp+ 1; 

69: pc:=mbr, 

goto 0; 

70: a:=ac; {SWAP} 

71: ac:=sp; 

72: sp:-a; 

goto 0; 

73: alu:-tìr, 

if n then goto 76; 

74: a.*=/r; {INSP} 

a:-band (a, smask)\ 

75: sp:=sp+à\ 

goto 0; 

76: a:=/r; {DESP>; 

a:=band (a, smask) , 

77: a:=inv (a); 

78: a.=a + 1; 
sp:=sp+a; 
goto 0; 


Hình 4.20 { tiếp theo ) 
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Cấu trúc Máy tính 


Các tên nhãn vẫn được giữ như trước để có thể dễ dàng so sánh 
2 vi chương trình và cú pháp cũng vậy. Ta có thề viết vi chương 
trình bằng cách dùng ký hiệu hợp ngữ ( nghĩa là các opcode trong 
hình 4.17 ) nhưng thay vào dó chúng ta sử dụng ngôn ngữ MAL lần 
nữa vì dễ đọc hơn nhiều. Lưu ý là các phát biểu MAL có dạng 
alu : = reg sứ dụng vi lệnh TEST để thiết lập các bít N và z. Chắc 
chắn chúng ta hiểu được sự khác nhau giữa vi chương trình ở dạng 
sô' nhị phân khi được nạp vào bộ nhớ điều khiển và phiên bản hợp 
ngữ được cho dưới dạng vãn bản. 

Vi chương trình này đơn giản hơn vi chương trình trước bởi vì 

mỗi dòng chì thực hiện một thao tác. Kết quá là nhiều dòng trong 

vi chương trình trước phái chia thành 2, 3 hoặc thậm chí 4 dòng 

trong vi chương trình này. Một đặc tính khác cùa thiết kế dọc, làm 

tăng sỏ vi lệnh, là thiếu các chi thị 3-địa chí. Thí dụ ơ các dòng 22 

và 27 trong vi chương trình trước. 

. chưdry 

Vi chương trình ban đầu dùng 79 từ 32-bit, tổng cộng là 2528 bit 
cho bộ nhớ điều khiển. Vi trình thứ 2 sử dụng 160 từ 12-bit, tổng 
cộng là 1920 bit. Sự khác nhau này làm tiết kiệm được 24 % bộ nhớ 
điều khiến. Với một máy tính đơn chip, ta cũng tiết kiệm được 24 % 
vùng chip cần cho bộ nhớ điều khiển, nhờ đó dề chế tạo và giá 
thành rẻ hơn. Điều bảt lợi phái trả cho việc tiêt kiệm bộ nhớ điều 
khiển là phái tốn nhiều vi lệnh cần được thực thi cho một chỉ thị 
macro. Thông thường, điều này làm cho máy có tôc độ chậm hơn. 
Do đó, những máy đắt tiền có tốc độ nhanh có khuynh hướng dùng 
phương pháp vi lệnh ngang và những máy rẻ hơn có tốc độ chậm sẽ 
dùng vi lệrrh dọc. 

Sự tổn tại các vi lệnh được mà hóa, như trong máy Mic-2, 
làm nảy sinh một số vấn dề có tính triết học quan trọng liên quan 
đến định nghĩa vi lập trình là gì. Tập vi lệnh ờ hình 4.17 hầu như 
chấp nhận tập chỉ thị của ngôn ngữ máy qui ước của một máy tính 
mini hoặc một máy vi tính rất đơn giản. Thí dụ máy PDP-8 là một 
máy tính mini với từ 12-bit, các chỉ thị của máy này không hoàn 
toàn mạnh hơn. Y nghĩa của các chỉ thị luôn gắn liền với phần cứng 
( mạch hoặc PLA giải mã OP ), người ta có thể chứng tỏ rằng máy 
Mic-2 thực sự là một máy không được vi lập trình, mà ngẫu nhiên 






có một phần mềm phiên dịch chạy trên máy này, chưa chạy trên 
máy nào khác. Nếu vi chương trình cho máy dọc được lưu trữ trong 
bộ nhớ chính ( như trên IBM 370/145 ), sự phân biệt giữa máy dược 
vi lập trình dọc và một máy kết nôi cứng ( hardvvired ) trở nên ít rõ 
ràng hơn. Để xử lý triệt đế hơn về mã hóa và cơ chẽ song song 
trong vi mã, hãy xem Dasgupta ( 1979 ). 

4.5.2 Lập trình nano 

Những thiết kê đã tháo luận đều có 2 bộ nhớ : bộ nhớ chính 
( dùng để chứa chương trình cấp 2 ) và bộ nhớ điều khiển ( dùng để 
chứa vi chương trình ). Một bộ nhớ thứ 3, bộ nhớ nano 
( nanostore ) có sự thỏa hiệp đáng chú ý giữa vi lập trình dọc và 
ngang. Lập trình nano thích hợp khi có nhiều vi lệnh xuất hiện 
nhiều lần. Vi chương trình hình 4.6 không có đặc tính này. Hầu hết 
vi lệnh thường xuất hiện là vi lệnh chỉ chứa rcí, và chỉ xuât hiện 
5 lần. 

Hình 4.21 minh họa khái niệm về lập trình nano. Trong hình 
(a), một vi chương trình với n vi lệnh, mỗi vi lệnh có w bit được 
trình bày. Cần tống cộng nw bit cho bộ nhớ điều khiển để chứa vi 
chương trình. Giả sử rằng, một nghiên cứu về vi chương trình nói 
rằng chỉ có m vi lệnh khác nhau trong 2" khá năng thực sự được sứ 
dụng, với m « n. Một bộ nhớ nano đặc biệt m từ w -bit có thể được 
dùng để chứa các vi lệnh đơn. Mỗi vi lệnh trong chương trình gốc 
sau đó được thay thế bằng địa chỉ của từ trong bộ nhớ nano chứa vi 
lệnh đó. Do chỉ có m từ trong bộ nhớ nano, nên bộ nhớ điểu khiển 
chỉ cần có độ rộng là log 2 m bit ( làm tròn thành số nguyên ), như 
trình bày trong hình 4.21 (b). 

Vi chương trình được thực hiện như sau. Từ đầu tiên được tìm 
nạp từ bộ nhớ điều khiển. Sau dó từ được dùng để chọn một từ 
trong bộ nhớ nano, được tìm nạp và đặt vào thanh ghi vi lệnh. Sau 
đó các bit của thanh ghi này được dùng để điều khiển các cổng cho 
một chu kỳ. Vào cuối chu kỳ, từ kế tiếp được tìm nạp từ bộ nhớ điều 
khiển và quá trình được lặp lại. 

Thí dụ, giả sử vi chương trình ban đầu có 4096 X 100 bit nhưng 


chí có 128 vi lệnh khác nhau xuất hiện. Một bộ nhớ nano 128 X 100 
bit cũng dii đê chứa tất cả vi lệnh cần thiết. Lúc này bộ nhớ điều 
khiển trớ thành 4096 X 7 bit, mỗi từ trỏ tới một chỉ thị nano. Bộ 
nhớ tiết kiệm được trong ví dụ này là : 

Tiết kiệm = 4096 X 100 - 4096 X 7 - 128 X 100 = 368128 bit 

Cái giá phai trả cho việc tiết kiệm bộ nhớ là tốc độ thực hiện sẽ 
chậm đi. Máy với bộ nhớ diều khiển 2 câ'p sẽ chạy chậm hơn máy 
nguyên thúy ban đầu do bới chu kỳ tìm nạp bảy giờ cần phải tham 
chiếu bộ nhổ 2 lần, một lần tham chiếu bộ nhớ điều khiển và một 
lần tham chiếu bộ nhớ nano. Hai lần tìm nạp này không được 
chồng lên nhau. 



Log 2 m 



<b) 


Hình 4.21 (aí Một vi trình qui ước (b) Một chương trình nano tương ứng 
nêu chi có m vi lệnh đơn xuât hiện trong vi chương trình 

Microprogram ; vi chương trình 
Nanoprogram : chương trình nano 

Lập trình nano hầu như có hiệu quả khi sử dụng nhiều vi lệnh 
giông nhau. Nêu 2 vi lệnh gần như giống nhau có thể xem như 
giống nhau thực sự, vi chương trình sè chứa ít hơn các vi lệnh phân 
biệt, mỗi vi lệnh sẽ có tần số sử dụng cao hơn. Sự thay đổi về ý 
tường cơ bản cho phép điều này là đúng. Các từ trong bộ nhớ nano 
có thê được tham số hóa. Thí dụ, 2 vi lệnh có thể chỉ khác nhau 
trong trường cho biết thanh ghi nào được đưa lên bus. Bằng cách 
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đặt sô của thanh ghi trong bộ nhớ điều khiển thay vì trong bộ nhớ 
nano ( nghĩa là đặt các zero vào trường thanh ghi trong các chỉ thị 
nano ), 2 vi lệnh đều có thể trỏ tới cùng một từ trong bộ nhớ nano. 
Khi từ được tìm nạp và đưa vào thanh ghi vi lệnh, vùng thanh ghi 
được lấy từ bộ nhớ điều khiển thay vì từ bộ nhớ nano. Việc lắp một 
thanh ghi vi lệnh có một phần từ bộ nhớ điều khiển và một phần 
từ bộ nhớ nano rõ ràng cần có một phần cứng chuyên dụng, nhưng 
không dặc biệt phức tạp lắm, Dĩ nhiên, dùng phương pháp này sẽ 
làm tăng bề rộng của bộ nhớ điều khiển, bù lại ta sè có bộ nhớ 
nano nhỏ hơn. 


4.5.3 Cải tiên hiệu suất 

Mặc dù mục tiêu của lập trình nano là làm giảm kích thước bộ 
nhớ điều khiển, thậm chí với cái giá phái trà là tốc độ thực thi sẽ 
chậm hơn, cặp tổng sô thời gian và nỗ lực củng đi theo chiều nghịch 
nhau : cố gắng tăng tốc độ thực thi sẽ phải tôn nhiều cho bộ nhớ 
điều khiển. Hai mục tiêu thiết kê dường như không tương thích này 
liên quan đến các mục tiêu thương trường khác nhau là - tạo ra các 
máy không đắt lắm và tạo ra các máy có tốc độ nhanh, Trong phần 
này chúng ta sẽ xét một số' phương pháp làm cho vi cấu trúc mẫu 
của chúng ta có thế được tăng tếc độ nhằm tạo ra các máy chạy 
nhanh hơn. 

Cho đến bây giờ, ta đã giả thiết rằng tất cả 4 chu kỳ con đều có 
chiều dài bằng nhau. Phương pháp này tuy đơn giản nhưng ít khi 
dẫn đến hiệu suất tôi ưu bơi vì trong 4 chu kỳ con sẽ có 1 chu kỳ 
chiếm nhiều thời gian hơn 3 chu kỳ con kia. Tất cả các chu kỳ con 
có chiều dài bằng nhau là trường hợp xâu nhất làm giảm tốc độ 
máy. Phương pháp khắc phục là cho phép mỗi chu kỳ con có thời 
gian độc lập với những chu kỳ con khác. Chiều dài của mỗi chu kỳ 
con có thể được thiết lập theo lượng thời gian cần thiết để thực 
hiện công việc, và không dài hơn. 

Mặc dù đây là một bước trong hướng đi đúng, nhưng người 
ta cũng dè dặt bởi vì chiều dài của mổi chu kỳ con vẫn được quyết 
định bởi trường hợp xâu nhất đối với chu kỳ con đó. Thí dụ xét chu 
kỳ con 3 trong thí dụ của chúng ta. Nếu thao tác của ALU là phép 
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cộng, có lẽ ALU cần nhiều thời gian hơn ( do trì hoãn truyền số 
nhớ ) so với nếu thao tác chỉ là chọn A. Nếu thời gian dành cho chu 
kỳ con 3 là một hằng số dược xác định khi thiết kế máy, hằng số 
này phải là thời gian dành cho phép cộng, không phải cho thao tác 
chọn A. Một phương pháp khác là cho phép thời gian của chu kỳ 
con được quyết định bởi thao tác cụ thế dược thực hiện, do vậy được 
thiết lập với thời gian ngắn có thể được. 

Một khi quyết định cho phép mỗi chu kỳ con phụ thuộc vào thao 
tác, ta phái tìm cách hiện thực phương pháp này. Làm giảm hoặc 
làm tăng tốc độ xung clock là một khó khãn về kỹ thuật, do vậy 
thay vào đó ta dùng một xung clock chủ có chu kỳ ngắn hơn nhiều 
so với thời gian cua một chu kỳ con. Lúc đó mỗi chu kỳ con sẽ tồn 
tại trong một số xung. Thí dụ nếu thời gian của ALU có thể thay 
đối từ 75 thành 150 nsec, ta có thể dùng một xung clock chủ có chu 
kỳ 25 nsec, và các chu kỳ con sẽ chiếm từ 3 đến 6 chu kỳ xung clock 
chủ. 

Một cáu hòi khác là : làm thế nào máy biết được chu kỳ con cần 
dài bao nhiêu ? Ớ đây có thể dùng một trong 2 phương pháp. Với 
phương pháp thứ nhất, tự bán thân vi lệnh có chứa 1 hoặc nhiều 
trường cho biết rõ ràng thời gian định thì. Với phương pháp thứ 
hai , thời gian định thì nhận dược dựa vào các trường thao tác 
( bàng cách dùng 1 PLA ), cách giống như tất cá các tín hiệu điều 
khiến khác được tạo ra cho máy dọc. Phương pháp đầu tốn bộ nhớ 
điều khiển và phương pháp thứ hai phải tôn mạch logic và thời 
gian giái mã. 

Một phương pháp khác đế làm tăng hiệu suất máy là gia tăng 
tính linh động của các vi lệnh nhảy có điều kiện. Thí dụ xét chỉ thị 
macro SKIP LESS so sánh AC với từ nhớ và bỏ qua chỉ thị macro 
kế nếu AC nhỏ hơn. Việc so sánh yêu cầu trừ AC cho từ nhớ, điều 
này có thể dẫn đến tràn số học như minh họa trong hình 4.22. 

Do khả năng của tràn sô' học, ta không thể biết toán hạng nào 
nhỏ hơn chỉ bằng cách xét bit dấu của kết quả. Trong thí dụ 4 của 
hình 4.22, AC nhỏ hơn từ nhớ nhưng AC - từ nhớ ( AC trừ từ nhớ ) 
cho kết quả dương. Điều kiện đúng được kiểm tra là N EXCLUSIVE 
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OR V, trong đó V cho biết có hay không có sự tràn số học. ( phần 
cứng thiết lập bit V mỗi khi số nhớ trong bit dấu khác với sô" nhớ 
ngoài bit dấu ). 

May mắn là hầu hết các ALU đều tạo ra không chỉ bít N và z 
mà còn có bit V và c. Tuy nhiên, nếu vi lập trình viên chỉ sử dụng 
4 lệnh nhảy có điều kiện, một cho mỗi một NZVC, chỉ thị macro 
SKIP LESS sẽ cần nhiều vi lệnh. Để linh động hơn, nhiều máy 
không có khả năng kiểm tra riêng các bit trạng thái ALƯ. Thay 
vào đó, dùng một bit cua vi lệnh đơn để làm cho NZVC dược OR với 
4 bit thấp của trường ADDR và thực hiện nhảy. Một sô thí dụ được 
cho trong hình 4.23. Nếu tất cả 4 bit thấp đều là 0, chỉ thị sẽ trở 
thành chỉ thị nhảy 16-đường. Nếu tất cả đều là 1, chỉ thị nhảy trở 
thành nhảy vô điều kiện tới một dịa chỉ cụ thể kêt thúc bằng 1111. 


AC 

Mem 

000100 

ooooso 

000100 

170000 

077777 

177775 

100001 

000010 

000010 

100001 


000030 

N=0 

V=Õ 

010100 

N=0 

V=Õ 

100002 

N = 1 

v=l 

077771 

N=0 

V=1 

100007 

N=1 

V=1 


Hình 4.22 Một số thí dụ về phép trừ bù 2 16-bit trong cơ số 8. Các bit N 
và V cho từng kết quả cũng dược thể hiện 


ADDR 

Reld 

NZVC 

Address 
Ịumped to 

10000000 

1001 

10001001 

10001000 

1001 

10001001 

10001011 

1001 

10001011 

10001011 

1000 

10001011 

10001011 

OOOỜ 

10001011 

10001111 

0000 

10001111 

10001111 

1100 

10001111 

10000000 

1100 

10001100 


Hình 4.23 Một số thí dụ về nhảy nhiều dường dựa vào NZVC 
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ADDR Fieìd : trường địa chỉ ADDR 
Ađđress jumped to : địa chỉ nhảy đên 

Với tiện ích này chỉ thị SKIP LESS trở nên dễ phiên dịch hơn 
nhiều. Thí dụ ta chọn trường ADDR kết thúc bằng 0101, nghĩa là 
10000101 ( nhị phân ) và thực hiện nhảy. Các vi lệnh ớ 10001101 
và 10000111 xử lý nhảy thành công, các vi lệnh ở 10000101 và 
10001111 xử lý nhảy bị hỏng. Không cần giải mã thêm nữa. Chúng 
ta cũng có thể sử dụng một địa chỉ nền kêt thúc là 0000 thay vì 
0101 nhưng những bít này vô cùng quí giá, bởi vì chúng là những 
bit duy nhất có thể sử dụng cho các lệnh nhảy 16 đường (16-way). 
Vì lý do này, chúng không được chọn một cách bât cẩn. 

Rõ ràng là với loại diều khiến trình tự vi lệnh này, việc sắp xếp 
các vi lệnh trong bộ nhớ điều khiển có thế trở nên phức tạp thực 
sự. Vi lệnh đầu tiên thực hiện theo sau một nhảy 16-đường phải tự 
chứa một nháy vô điều kiện, bởi vì từ theo sau { trừ từ cuối ) sẵn 
sàng được dùng như là một dích nháy. Mỗi vi lệnh nên nhảy tới 
đâu ? Chắc chắn là không phải địa chỉ có dạng xxxxOOOO, bởi vì 
chúng rất quí giá, tất cả những địa chi khác, trừ nhừng địa chỉ có 
dạng xxxxllll, cũng có thể cần thiết vào một lúc nào đó. Quyết 
định phải được thực hiện cẩn thận, tránh vượt ra ngoài một loại địa 
chỉ nào đó. Thí dụ khi hết tất cả địa chỉ chẵn, không thể kiềm tra 
bit c được nữa, vì thế việc chọn các địa chỉ phải được thực hiện 
thật cẩn thận. 

4.5.4 Sử dụng dường ông 

Một phương pháp khác nữa nhằm tăng tốc độ máy là xây dựng 
phần cứng có nhiều khối chức năng và dùng dường ống cho chúng. 
Trong hình 2.5 ta đã thây cách làm việc của một đường ông 5 đơn 
vị. Trong hình 4.24 ta thấy rằng nếu chỉ thị 1 được tìm nạp trong 
chu kỳ 1, chỉ thị này sẽ được thực hiện trong chu kỳ 5. Tương tự, 
nếu chỉ thị 4 được tìm nạp trong chu kỳ ( nghĩa là khe thời gian 
[ time slot ] ) 8, được giải mã trong chu kỳ 9, và v.v..., chỉ thị này sẽ 
được thực hiện trong chu kỳ 12. Dưới các điều kiện tối ưu, trong mỗi 
chu kỳ sau đó, một chỉ thị được thực hiện, với một tốc độ thực thi 
trung bình là một chỉ thị cho một chu kỳ, thay vì một chỉ thị cho 
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mỗi 5 chu kỳ. 


Cycle 

1 23456789 10 11 


Instructlon tetch 

1 

2 

B 





4 

5 

6 

7 

8 

9 

Instruction decode 


1 

2 

B 





4 

5 

6 

7 

8 

Address calculatlon 



1 

2 

B 





4 

5 

6 

7 

Operand tetch 




1 

2 

B 





4 

5 

6 

Execution 





1 

2 

B 





4 

5 


Hình 4.24 Một đường ông 5 tầng. Các chữ số được dùng đê gán thứ tự các 
chi thị. Chi thị được đánh dấu B là chi thị nhay cu điều kiện. 

Cycle : chu kỳ 

Instruction fetch : tìm nạp chỉ thị 
Instruction decode : giái mã chỉ thị 
Adđrress calculation : tính toán địa chí 
Operation fetch : tìm nạp chi thị 
Execution : thực thi 

Đáng tiếc là, các nghiên cứu cho thây khoảng 30 % cúa toàn bộ chỉ 
thị đều là các chỉ thị nhảy, chúng phá vỡ phương thức truyền theo 
đường ống. Các chỉ thị nhảy có thể được phân thành 3 loại : không 
điều kiện, có điều kiện và lặp vòng. Chỉ thị nhảy không điều kiện 
báo cho máy tính dừng việc tìm nạp các chì thị kê tiêp và đi tới 
một địa chỉ cụ thể nào đó. Chì thị nhảy có diều kiện kiểm tra điều 
kiện và thực hiện nhảy nêu điều kiện được thóa. Một thí dụ điển 
hình là chỉ thị kiềm tra một thanh ghi và thực hiện nhảy nêu 
thanh ghi chứa zero. Nếu thanh ghi không chứa zero, chỉ thị nháy 
không được thực hiện và điều khiển tiêp tục ờ chuỗi chỉ thị hiện 
tại. 

Các chỉ thị lặp vòng làm bộ đếm lặp giảm xuống 1 và sau đó 
nháy trở về đỉnh vòng lặp nêu bộ đêm khác không ( nghĩa là vần 
còn nhiều vòng lặp phải thực hiện ). Các chỉ thị lặp là một trường 
hợp đặc biệt quan trọng của các chỉ thị nhảy có điều kiện bời vì 
người ta biết trước rằng chúng hầu như luôn luôn thành công. 
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Điểu gì sẽ xảy ra với cho đường ống ở hình 4.24 khi một chỉ thị 
nhảy có điều kiện được đánh dâu là B. Chỉ thị kế tiếp được thực thi 
có thề là một chi thị theo sau chỉ thị nháy, nhưng cũng có thể là 
địa chỉ được nháy tới, gọi là đích nháy ( jump target ). Từ đó, bộ 
tìm nạp chỉ thị không biết phải tìm nạp chỉ thị nào, phải trì hoãn 
và không thê tiếp tục được nữa cho tới khi chỉ thị nhảy được thực 
hiện. Hậu quá là dường ông bị trông. Chỉ sau khi chu kỳ thứ 7 hoàn 
tât bộ tìm nạp mới biết chỉ thị sẽ được thực thi kế tiếp. 

Thực tế chỉ thị nhảy làm mất 4 chu kỳ, gọi là jump penalty . Nếu 
cứ mỗi 3 chỉ thị lại có một chỉ thị nhảy, rỏ ràng sự mất mát về hiệu 
suất là đáng kể. 

Nhiều nghiên cứu đã lấy lại được một phần hiệu suât này 
í DeRosa và Levy, 1987; McFarling và Hennessy, 1986; Hwu at al., 
1989; và Lilja, 1988 ). Điều đơn giản nhất để thực hiện là hy vọng 
chí thị nhảy sẽ không xuất hiện, và thậm chí tiếp tục làm đầy 
đường ông như thê là chí thị nhảy là một chỉ thị số học đơn giản. 
Nếu thực sự chí thị nhảy không Xuất hiện, ta sẽ không bị mất gì. 
Nếu xuâ't hiện, ta phải tiêu diệt các chỉ thi hiện tại còn trong 
đường ống , điều này được gọi là sự bóp chết ( squashing ), và bắt 
đầu lại. 

Sự bóp chêt lại gây ra những vấn dề riêng. Trên một sô máy, 
như là một sản phẩm phụ của việc tính địa chỉ, một thanh ghi có 
thê bị thay dối. Nêu chỉ thị đang bị bóp chêt làm thay đổi 1 hoặc 
nhiều thanh ghi, chúng phải được khôi phục lại, nghĩa là phải có 
một cơ chế để ghi lại các giá trị ban đầu của chúng. 

Điều này tạo ra một mô hình đơn giản về sự mất mát hiệu suất. 

Đặt pj là xác suất một chỉ thị là chỉ thị nhảy. 

Đặt Pt là xác suât chỉ thị nháy xuất hiện. 

Đặt b là jump penalty. 

Thời gian thực hiện trung bình ( tính bằng chu kỳ ) là tổng thời 
gian của 2 trường hợp; chỉ thị bình thường và chỉ thị nhảy. 

ait = (1 - Pj)( 1) + Pj[Pt{ 1 + b) + (1 - Pt)( D) 
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Thời gian trung bình của chỉ thị ait ( average instruction time ) 
là 1 + bPjPt. Vậy thì hiệu suất thực thi là l/(l+bPjPt). Với b = 4, 
Pj = 0,3 và Pt = 0,65 ( giá trị đo tiêu biểu ), máy có tốc độ chậm 
hơn 60 % khả năng. 

Điều gì có thể được thực hiện để cải tiến hiệu suất ? Đê bắt đầu, 
nếu dự đoán được đường chỉ thị nhảy sẽ đi đến, ta có thể tìm nạp 
chỉ thị thích hợp và loại bỏ được penalty. Trong công thức tính hiệu 
suất ta có thể thay Pt bằng Pw, xác suất dự đoán sai. 

Có 2 loại dự đoán là ; tĩnh ( thời gian biên dịch ) và động ( thời 
gian thực thi ). Với dự đoán tĩnh, trình biên dịch sẽ dự đoán về 
từng chỉ thị nhảy mà trình biên dịch tạo ra. Thí dụ với các chỉ thị 
lặp vòng, dự đoán nhảy trơ về đỉnh của vòng lặp hầu như luôn luôn 
đúng. Khi kiêm tra một điều kiện không chắc chắn, như là chi thị 
gọi hệ thống trả về một mã sai, hẩu như chắc chắn chi thị nhẩy 
không xầy ra. Trong nhiều trường hợp, các chỉ thị khác nhau được 
dùng cho các trường hợp này, và sự xem xét opcode cung cấp một 
gợi ý quan trọng. 

Một sơ đồ tỉ mỉ hơn cho các nhà thiết kế máy cung cấp 2 opcode 
cho mỗi loại chỉ thị nháy, và có trình biên dịch sử dụng opcode thứ 
nhất nếu nghĩ"* rằng chỉ thị nhảy sẽ xuât hiện, ngược lại sè dùng 
opcode thứ 2. Hoặc là, đối với những chương trình khó sứ dụng, 
chương trình được chạy trước trên bộ mô phỏng, và ghi lại hành vi 
thực tế của mỗi chỉ thị nhảy. Sau đó, chương trình nhị phán có thê 
được ráp nôi bằng cách thay thê mồi chỉ thị nhảy bằng opcode thích 
hợp ( có thể là xuất hiện / có thể là không xuất hiện ). 

Phương pháp dự đoán kia là phương pháp động. Trong thời gian 
thực thi, vi chương trình thiết lập một bảng địa chỉ chứa các chí thị 
nhảy và theo dõi hành vi của từng chỉ thị. Phương pháp này có xu 
hướng làm giảm tốc độ máy do lưu giữ bản ghi, vì thê cần sự giúp 
đỡ của phần cứng. Các phép do cho thây rằng đạt được chính xác 90 
% theo phương pháp này là không khó. 

Dự đoán nháy không phải chí là 1 phương pháp duy nhất. 
Phương pháp dự đoán khác là thử xác định bên trong đường ống, 
đường mà chỉ thị nhảy sẽ đến. Một số phép kiểm tra, như là nhảy 
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nếu bằng, thực hiện dễ hơn so với nhảy nêu nhỏ hơn. Chỉ thị trước 
có thể được thực hiện bằng một mạch so sánh, trong khi chỉ thị sau 
cần một chu kỳ đường dữ liệu đầy đủ để thực hiện phép trừ. Với 
phương pháp này, mỗi khi gặp chỉ thị nhảy, vi chương trình thực 
hiện việc kiểm tra nhanh trong tầng trước cúa đường ông dể xem có 
thể giải quyết nhảy tức thời hay không. Nếu xảy ra như vậy, nơi 
tiếp tục tìm nạp chi thị sẽ được biết. 

Các trình biên dịch có thể giúp đỡ nhiều. Thí dụ khi người lập 
trình viết một vòng lặp bước i từ 1 tới 10, trình biên dịch sẽ kiểm 
tra ỉ đê xem i có bằng 10 chưa hơn là xem i có nhó hơn 11 hay 
không, vì vậy vi chương trình có thể xoay sớ bàng một phép so 
sánh thay vì một phép trừ. 

Đê xứ lý những chỉ thị nháy không thể giải quyết trước, trình 
bién dịch có thề tìm một điều gì đó có ích cho máy tính để làm 
trong lúc đợi chi thị nháy được thực thi. Xem hình 4.25 (a) ta thấy 
theo sau phát biểu sô" học là một phép kiểm tra. Một trình biên 
dịch tỏi ưu có thể sinh ra một mã giông như hình 4.25 (b), đây 
không phải là chi thị hợp lệ cúa Pascal mà là trình bày trật tự của 
các sự kiện. Trước tiên trình biên dịch tạo mã kiểm tra, sau đó thực 
hiện phép toán sô học. Sau khi chỉ thị nhảy đả đi yào đường ống, 
vài chì thị thông thường theo sau. Không có vấn đề gì khi các chỉ 
thị thông thường được thực thi, do vậy không cần dự đoán và không 
cần thực hiện việc bóp chết. Đế sứ dụng kỹ thuật này có hiệu quả, 
trong thời gian thiết kế, vi lập trình viên và người viết trình biên 
dịch phải làm việc chặt chẽ với nhau. 


a := 6+c; 
if b < c 


lf b <c 

a .*= b+c; 


then statement; 
(a) 


then statement; 
(b) 


Hình 4.25 (a). Một đoạn Pascal (b) Cách xử lý của trình biên dịch. 
Statement : phát biểu 
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Nếu tất cả đều thất bại, luôn luôn có khả năng cả 2 đường theo 
sau là song song. Việc thực hiện do vậy cần có 2 đường ống trong 
phần cứng và không loại trừ vân đề bóp chết. Trên những máy tính 
mà hiệu suất và giá cả không phải là vấn đề, đôi khi phương pháp 
này vẫn được sử dụng. Dĩ nhiên, nếu cả 2 đường ống đều gặp một 
chỉ thị nhảy khác trước khi chỉ thị nhảy đầu được giải quyết., vấn 
đề sẽ trở nên phức tạp hơn. Việc dùng vài chục đường ông đế xử lý 
trường hợp xấu nhất không thế là một ý tường hay. 

Xét cho cùng lý thuyết này có the thực hiện được điều gì, lúc 
này hãy trở lại thí dụ cùa chúng ta. Trong thí dụ không có các khôi 
phần cứng phân biệt đê tìm nạp, giãi mà, và v.v..., vì thế không thè 
dùng nhiều đường ống, nhưng với những thay đối nhô trong vi 
chương trình, ta có thề nhận được một lượng giói hạn về sự chồng 
chập giữa việc tìm nạp và thực thi các vi lệnh, đây cũng là một 
dạng của đường ống. 

Thí dụ trong hình 4.10, nếu bằng cách nào đó vi lệnh kế tiếp 
được tìm nạp trong chu kỳ con 4, chu kỳ con 1 sẽ không còn cần 
thiết nừa, và mạch tạo xung clock chỉ cần tạo ra các xung cho các 
chu kỳ con 234234234 ... Như ta dã thấy, vấn đề chính chỉ xảy ra 
trong việc điều khiển các vi lệnh nhảy có điều kiện. Nếu máy đợi 
cho tới khi các đường trạng thái của ALƯ có giá trị sử dụng trước 
khi bắt đầu tìm nạp vi lệnh kế tiếp, điều này quá trễ : thực tế chu 
kỳ đã đi qua và chồng chập một ít có thể đạt được. Trên một sô' 
máy vấn đề được giải quyết bằng cách chỉ dùng các đường trạng 
thái của ALƯ từ chu kỳ trước, dĩ nhiên phải được chốt để giữ chúng 
khỏi bị biến mất, Những giá trị này cỏ giá trị sử dụng vào lúc bắt 
đầu mỗi vi lệnh, vì thế việc tìm nạp kế tiếp có thể bắt đầu ngay khi 
việc tìm nạp hiện tại hoàn tất, khá lâu trước khi chỉ thị hiện tại 
được thực thi hoàn tất. Cách thực hiện này là vấn đề rất phức tạp 
đối với vi lập trình viên. 

Về kỹ thuật, người ta có thể viết các vi chương trình cho một 
máy như vậy theo một phương pháp hợp lý. Thí dụ để kiểm 
tra từ nào dó trong bộ nhớ nháp và thực hiện nhảy nếu kết 
quả âm, vi chương trình có thể đưa từ vào ALƯ bằng một vi lệnh 
not chứa thao tác nhảy. 
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Vi lệnh kế tiếp là một no-op với thao tác nhảy có điều kiện; 
nghĩa là chi thị không thực hiện điều gì cả ngoài việc kiểm tra các 
bit trạng thái được chôt cúa ALƯ và nhảy. Giá phải trả cho việc lập 
trình theo cách hợp lý này là tăng gâp 2 thời gian nhảy, một đề 
nghị không được ưa chuộng. 

Giải pháp duy nhât là lấy ra một lọ thuôc aspirin và thử làm 
một cỏ gắng lớn nhất cho tình huống. Thí dụ, vi lập trình viên có 
thế dự đoán đường mà chí thị nhảy có điều kiện thường đến, và 
dùng vi lệnh thứ 2 đế bắt đầu thực hiện công việc có lẽ sẽ được cần 
đến. Đáng tiếc là, nếu chỉ thị nhảy đi đến một đường khác, ta cần 
phái thực hiện một sự bóp chết nào đó. 

Một thí dụ đơn gián, hãy viết lại các dòng từ 11 đến 18 trong 
hình 4.16 đê máy thực hiện việc tìm nạp và thực thi vi lệnh chồng 
chập lẽn nhau. Kết quả được trình bày trong hình 4.26(a). Trong thí 
dụ này chúng ta gặp may bời vì dựa vào việc thực thi dòng 11 ta 
biết rằng má cho cả 2 chỉ thị ADDD hoặc SUBD sẽ theo sau, và cả 
2 đều bắt đầu với cùng một vi lệnh. Do đó, ta chí cần đặt vi lệnh 
chung vào dòng 12 đê giữ cho máy bận trong lúc chỉ thị nhảy đang 
được thực thi. 

Một thí dụ khác ít thú vị hơn được trình bày trong hình 4.26 (b). 
Ở dòng 52 ta biết rằng hoặc chỉ thị PSHI hoặc chỉ thị POPI sẽ thao 
sau, nhưng đáng tiếc là 2 chương trình này không có vi lệnh đầu 
tiên giống nhau. Tuy nhiên giả sử rằng, theo một phân tích thống 
kê về các chương trình cùa máy Mac-1 cho thấy chỉ thị PSHI phổ 
biên hơn chì thị POPI, ta có thề tiên hành như trình bày trong 
hình 4.26(bJ. Mọi việc đối với chỉ thị PSHI đều tốt đẹp, nhưng đối 
với POPI thì khác, khi tới dòng 56 việc đọc bộ nhớ đã được khởi 
động, cho từ sai. Tùy thuộc vào các chi tiết chính xác của phần 
cứng, ta có thể hoặc không thể bỏ qua việc đọc bộ nhớ nửa chừng 
mà không làm cho hệ thống không hoạt động được. Nếu không thể 
bỏ qua, ta chỉ việc kết thúc việc đọc và sau đó bắt dầu việc đọc 
đúng. Trong thí dụ này chỉ thị POPI chiếm 15 vi lệnh thay vì 13 
như trong hình 4.16. Tuy nhiên, nếu việc sự dụng phương pháp 
chồng chập lên nhau làm giảm được thời gian cơ bản của vi lệnh 
xuống 15 %, chỉ thị POPI bây giờ sẽ nhanh hơn trước kia. 
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11: aìu:-tìr, 

12: mar:~ir; rơ; II n then goto 16; 


52: alu:=tlr; 

53: mar:=ac; rơ; II n then goto 56: 

54: sp:=sp+(-1); rơ; 

55: mar:=sp;wr; goto 10; 

56: rơ\ 

57: mar:=sp; sp:=sp+ 1: rơ, 

58: rơ; 

59: mar:=ac; wr; goto 10; 


13: rơ; 

14: ac:=mbr+ac; goto 0; 


16: ac:=ac+1; rơ; 

17: a:=inv (mbr); 

18: a:=ac:=ac+a; goto 0; 


(a) 


(b) 


Hình 4.26 Hai thí dụ baơ gồm việc tìm nạp và thực thi vi lộnh chồng chập 

lên nhau. 

Nếu các chỉ thị nhảy nhiều đường được hình thành bằng cách 
OR NZVC với các bit tháp của ADDR thay vì kiềm tra từng bit 
riêng rẽ, tình huống trở nên phức tạp hơn nhiều. Hơn nừa, trên 
nhiều máy, sự chồng chập việc tìm nạp và thực thi các vi lệnh dược 
tiến hành theo cách như vậy để mà trong thời gian thực thi vi lệnh 
n , việc chọn vi lệnh n + 1 phải được thực hiện bằng cách dùng các 
bit trạng thái cúa ALU đã được chốt trước trong thời gian thực thi 
vi lệnh n - L Chúng ta sẽ không đuổi theo vân đề này ơ dây nừa, 
nhưng ít nhất, động cơ thúc đẩy cho sự định nghĩa của Rosin về vi 
lập trình bây giờ có thề rỏ ràng hơn. 

4.Ỗ.5 Bộ nhớ truy cập nhanh 

Theo lịch sử, CPU luôn luôn có tốc độ nhanh hơn bộ nhớ. Khi 
bộ nhớ dược cái tiến, CPU cũng được cải tiến, sự mất cân đối này 
vẫn không thay dối. Điều này có ý nghĩa gì trong thực tế sau khi 
CPU phát ra một yêu cầu tới bộ nhớ, CPU phải duy trì trạng thái 
nghỉ trong một thời gian đáng kể trong khi chờ bộ nhớ đáp ứng. 
Như ta đá thây, thông thường CPU thiết lập việc đọc bộ nhớ trong 
thời gian của một chu kỳ bus, và không nhận dữ liệu cho đến 2 
hoặc 3 chu kỳ sau đó, ngay cả khi không có trạng thái chờ ( wait 
State ). 

Thực ra, vấn đề không phải là công nghệ mà là kinh tế. Các kỹ 
sư biết cách xảy dựng những bộ nhớ có tốc độ nhanh như các CPU, 
nhưng chúng quá đắt để trang bị cho một máy tính có 1 megabyte 
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bộ nhớ hoặc nhiều hơn ( có lề ngoại trừ những siêu máy tính, nơi 
mà không có sự giới hạn về không gian và giá thành không là đôi 
tượng ). Vì thế việc chọn lựa trở thành việc có một dung lượng bộ 
nhớ nhò, tóc độ nhanh hoặc một dung lượng bộ nhớ lớn, tôc độ 
chậm. Dĩ nhiên chúng ta sẽ thích một bộ nhớ dung lượng lớn, tốc 
độ nhanh và giá thành thâp hơn. 

Điều đáng lưu ý là những kỹ thuật kết hợp một bộ nhớ nhỏ, tốc 
độ nhanh với một bộ nhớ lớn, tôc độ chậm đề có một bộ nhớ tôc độ 
nhanh, dung lượng lớn với giá thành hạ. Bộ nhớ nhanh, dung lượng 
nhó được gọi là cache { từ chữ cacher cúa tiêng Pháp, nghĩa là che 
dấu, và phát âm là “cash” ) được điều khiển bới vi chương trình. 
Phần dưới đây sẽ mỏ tả cách sử dụng các cache và cách chúng hoạt 
dộng. Có thể tìm thấy thêm nhiều thông tin trong ( Agarwal et al., 
1989; Farrens and Pleszkun, 1989; Kabakibo et al., 1987; Kessler et 
ah, 1989; Pohm and Agarwal, 1983; Przybylski et al., 1989; Smith, 
1982; và Wang et al., 1989 ). 

Qua nhiều năm, người ta biết rằng các chương trình không truy 
xuât bộ nhớ một cách hoàn toàn ngẫu nhiên. Nếu một tham chiếu 
bộ nhớ biết trước có địa chỉ là A, tham chiếu bộ nhớ kế tiếp một 
cách tổng quát sẽ ở vùng lân cận của A. Một thí dụ đơn giản là 
ngay trong chính chương trình. Ngoại trừ các chỉ thị nhảy và các 
chỉ thị gọi thú tục, các chỉ thị luôn được tìm nạp từ những vị trí liên 
tiếp trong bộ nhớ. Hơn nữa, hầu hết thời gian thực thi chương trình 
đều sử dụng cho các vòng lặp, trong đỏ một số giới hạn các chỉ thị 
dược thực hiện nhiều lần. Tương tự, một chương trình thao tác ma 
trận giông như tạo ra nhiều tham chiếu tới cùng một ma trận trước 
khi chuyển sang một ma trận khác. 

Việc quan sát các tham chiếu bộ nhớ tạo ra trong khoảng thời 
gian ngắn bất kỳ có khuynh hưởng chỉ sử dụng một phần nhỏ của 
bộ nhớ tổng thể được gọi là nguyên tắc địa phương ( locality 
principle ) và hình thành nền tảng cho tất cả hệ thôhg truy nhập 
nhanh ( caching System ). Ý tưởng chung là khi một từ được tham 
chiếu, từ này được mang từ bộ nhớ lớn, tôc độ chậm vào cache để 
cho trong thời gian kế khi từ này được sử dụng, từ sẽ được truy 
xuất với tốc độ nhanh. Một sắp xếp thông thường của CPU, cache 
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và bộ nhớ chính được minh họa trong hình 4.27. Nếu 1 từ được đọc 
hoặc được ghi k lần trong một thời gian ngắn, máy tính sẽ cẩn 1 
tham chiếu tới bộ nhớ chậm và ( k - 1 ) tham chiếu tới bộ nhớ 
nhanh, hiệu suất chung sẽ tốt hon khi k lớn. 


CPU board 


Memory board 



Hình 4.27 Bộ nhớ cache thường được đặt trên board CPU 

CPU board : board CPU 
Memory board : board bộ nhớ 

Smal, fast, expensive memory : bộ nhớ nhỏ, nhanh và đắt 
Large, slow, cheap memory : bộ nhớ lớn, chậm và rẽ 
Main memory : bộ nhớ chính 

Chúng ta có thể lập công thức cho tính toán này bằng cách đặt 
c là thời gian truy xuất cache, m là thời gian truy xuất bộ nhớ 
chính và h là tỉ lệ thành công ( hit ratio ), tỉ số giữa sô' lần tham 
chiếu cache với tổng sô' lần tham chiếu. Trong thí dụ nhỏ ở phần 
trên, h = (k-l)Ịk. Một sô' tác giả cũng định nghĩa tỉ lệ thất bại 
( miss ratio ) là ( 1 - h ). 

Với những định nghía này, ta có thể tính thời gian truy xuâ't 
trung bình nllư sau : 

Thời gian truy xuất trung bình = c + (1 - h) m 

Khi h -ỳ 1, tất cả các tham chiếu đều truy xuất cache và thời 
gian truy xuất trung bình tiến tới c. Mặt khác, khi h -ỳ 0, cần phải 
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tham chiếu bộ nhớ chính mọi lúc, thời gian truy xuất trung bình 
tiến tới c + m, trước tiên là thời gian c dùng để kiểm tra cache 
< không thành công ) và sau đó là thời gian m thực hiện tham chiêu 
bộ nhớ chính. Trên một sô hệ thông, việc tham chiêu bộ nhớ chính 
có thế được bắt đầu cùng lúc với việc tìm kiếm trên cache, sao cho 
nếu có một thất bại trên cache ( cache miss ) xảy ra, chu kỳ bộ nhớ 
đã được khới động. Tuy nhiên, phương pháp này yêu cầu bộ nhớ 
dừng ngay nếu việc tham chiếu cache thành công nên phức tạp hơn. 
Thuật toán cơ bán cùa việc tìm kiếm những từ nhớ trong cache và 
việc bắt đầu ( hoặc dừng ) tham chiẽu bộ nhớ chính tùy thuộc vào 
kết quá của việc tìm kiêm cache được điểu khiến bới vi chương 
trình. 

Có 2 cách tô chức cache cơ bán khác nhau được sử dụng, cùng 
với dạng thứ 3 là kết hợp của 2 cách trước. Với cá 3 loại, bộ nhớ 
chính được giả sử có 2 ni byte và đại khái được chia thành những 
khối 6-byte liên tiếp, tổng cộng sẽ có 2 n 7ò khối. Mỗi khôi có một 
địa chỉ là bội sỏ cùa ò. Kích thước khỏi, 6, thường là lũy thừa của 2. 

Loại cache đầu tiên là associate cache , một thí dụ của loại này 
được trình bày trong hình 4.28, Cache bao gồm sô' khe ( slot ) hoặc 
dòng ( line ), mỗi khe chứa một khôi và sô' của khôi cùng với 1 bit 
vaỉid cho biết khe đó hiện tại có đang được sử dụng hay không. Thí 
dụ ở hình 4.28 minh họa một cache có 1024 khe và một bộ nhớ 
chính có 2“ 1 byte chia thành 2 2 " khôi 4-byte. Trong associate cache , 
trật tự của các điếm nhập ( entry ) là ngẫu nhiên. 

Khi máy tính được reset, tất cả bit valid được thiết lập là 0, cho 
biết rằng không có điểm nhập nào của cache có giá trị. Giả thiết 
rằng chỉ thị dầu tiên tham chiếu một từ 32-bit ở địa chỉ 0. Vi 
chương trình sè kiểm tra tất cả các điểm nhập của cache để tìm ra 
giá trị 1 đang chứa khôi sô' 0. Nếu không tìm thây giá trị 1, lúc đó 
vi chương trình sẽ phát ra một yêu cầu bus để tìm nạp từ ở địa chỉ 
0 từ bộ nhớ chính và tạo ra một entry hợp lệ cho khối sô' 0 chứa 
nội dưng của từ ở địa chỉ 0. Nếu cần dùng từ này lần nừa trong thời 
gian kế, từ sẽ được lấy ra từ cache, loại bỏ được nhu cầu sử dụng 
bus. 
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Theo thời gian, càng có nhiều điểm nhập của cache được đánh 
dấu là hợp lệ. Nếu chương trình sử dụng ít hơn 1024 từ gồm chương 
trình và dữ liệu, cuối cùng toàn bộ chương trình và dữ liệu sẽ xuất 
hiện tron^ cache và chương trình sẽ chạy ở tốc độ cao, không phải 
thực hiện bất kỳ thao tác tham chiếu bộ nhớ chính nào trẽn bus. 
Nếu chương trình cần nhiều hơn 1024 từ, tại một thời điểm nào đó 
cache sẽ bị đầy và điểm nhập cũ sẽ phải bị thải bỏ để tạo chỗ trông 
cho điểm nhập mới. Trong thực tế, việc quyết định điểm nhập nào 
bị bỏ phải được thực hiện rất nhanh ( vài nanosecond ). VAX và 
nhiều máy khác chọn bỏ một khe theo kiểu ngầu nhiên. Những 
thuật toán khác được bàn đến trong chương 6 dưới tiêu đề bộ nhớ 
ảo, tại đó cũng xảy ra những vản đề tương tự. 
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Address number 
01 - 1 0 
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Valld Block number 
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1 
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2131 

1 

2 
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0 



1 

160248 

290380 
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(a) 


Hình 4.28 Một sơ đồ cache thí dụ la) Bộ nhớ chính với các khôi 4-byte 

(b) Assocỉative cache có 1024 khe 

Address : địa chi Block number : số của khôi 

Value : giá trị Valid : bit vaỉid 

1K lines : 1024 đường ( khe ) 

Vẽ bề ngoài phân biệt associatỉve cacìxe với các loại cache khác 
là mỗi khe đều có chứa sô của khôi và điểm nhập. Khi địa chỉ bộ 
nhớ được đưa ra, vi chương trình phải tính số khôi thích hợp ( dễ 
dàng ) và sau đó tìm kiếm sô' của khôi trong cache ( khó ). Để tránh 
việc tìm kiếm tuyến tính, associative cache có phần cứng đặc biệt 
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đế có thể so sánh đồng thời mọi điểm nhập với sô' của khối đâ cho, 
hơn là tạo vòng lặp tìm kiếm trong vi chương trình. Phần cứng này 
làm cho giá thành cúa associative cache cao hơn. 

Đề giảm giá thành, một loại cache khác được phát minh là, 
direct-mapped caehe. Loại cache này tránh được thao tác tìm kiếm 
bàng cách đặt mỗi một khôi vào trong một khe mà sô' của khe có 
thê được tính dề dàng từ sô' của khôi. Thí dụ sô' của khe có thể là số 
của khói modulo với số khe. Với các khối 4-byte ( nghĩa là 1 từ ) và 
1024 khe , sô của khe cho một từ ở địa chỉ A là { A/4 ) 
modulo 1024. Trong thí dụ ở hình 4.29 ta thấy rằng các từ ở các địa 
chi 0. 4096, 8192 và v.v. được ánh xạ trên khe sô 0 ; các từ ở các 
địa chi 4. 4100, 8192 và v.v... được ánh xạ trèn khe số 1, và v.v... . 

Trong khi dircct-mapped cache loại bỏ được vân đền tìm kiếm, 
loại cache nav tạo ra một vấn đề mới - làm thế nào đề biết từ nào 
trong sỏ nhiều từ được ánh xạ trên một khe đã cho hiện đang 
chiếm khe đó. Thực tế chúng ta đã tạo ra 1024 lớp tương đương dựa 
trên các số cua khôi modulo với kích thước cache. Trong thí dụ này, 
khe sỏ 0 có thế chứa một từ bâ't kỳ ở các địa chỉ : 0, 4096, 8192, 
v.v... Phương pháp đê cho biết từ nào hiện đang chứa trong khe là 
đưa một phần địa chỉ vào trong cache, ở trường Tag. Trường này 
chứa phần địa chi không thể được tính từ sô' của khe. 

Để làm rõ hơn vấn đề này, hãy xét một chỉ thị ở địa chỉ 8192 
thực hiện di chuyển một từ ở địa chỉ 4100 tới địa chỉ 12296. Số của 
khối tương ứng với địa chì 8192 được tính bằng cách chia 8192 cho 
4 ( kích thước khối trong thí dụ của chúng ta ) để được 2048. Kế 
tiếp số của khe được tính bằng cách lấy 2048 modulo với 1024, điều 
này tương tự như sử dụng 10 bit thấp của 2048. Số của khe là 0. 12 
bit cao chứa giá trị 2 ở trong trường Tag . Hình 4.29(a) trình bày 
một cache sau khi cả 3 địa chỉ được xử lý. 

Hình 4.29(b) trình bày cách địa chỉ được chia ra như thế nào. 2 
bit thấp luôn luôn là 0 ( vì cache làm việc với toàn bộ các khối và 
nhửng khối này là bội số cùa kích thước khối, trong thí dụ này là 4 
byte ). Kế tiếp là số của khe { 10 bit ) và cuối cùng là Tag ( 12 bit). 
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ỊẸậ 


Slot 

Valtd 

Tag 

Valve 

Addresses that use this Slot 

0 

1 

2 

12130 

0, 4096, 8192,12288,... 

1 

1 

1 

170 

4,4100, 8196,12292,... 

2 

1 

3 

2142 

8,4104, 8200,12296,... 

3 

0 



12, 4108, 8204, 12300,... 

4 

0 



16, 4112, 8208, 12304,... 

5 

0 



20, 4116,8212, 12308,... 






1023 

1 



4092, 8188,12284,... 


(a) 


Bits 12 10 2 

Tag ỉ Slot I 00 I 

(b) • 

Hình 4.29 (a) Direet-mapped cache với 1024 khe (b) Tính toán khe và 

Tag từ 1 địa chỉ 24-bit 

Addresses that use this slot : các địa chỉ sử dụng khe này 

Không khó lắm để lắp một phần cứng để trực tiếp, lấy ra sô' của 
khe và Tag từ một địa chỉ bộ nhớ bất kỳ. 

Thực sự là nhiều khối được ánh xạ trên cùng một khe của cache 
có thể gây ra nhiều vấn đề. Giả sử chỉ thị MOVE của chúng ta 
chuyển từ ở địa chỉ 4100 tới địa chỉ 12292 thay vì tới địa chỉ 12296. 
Cả 2 địa chỉ này đều được ánh xạ trên khe số 1. Tùy thuộc vào các 
chi tiết của vi chương trình, bất cứ sô" nào được tính cuối cùng sẽ 
được kết thúc trong cache, còn số khác sẽ bị gạt đi. Trong bản thán 
cache, điều này không phải là một tai họa, nhưng làm giảm hiệu 
suất của cache nếu có nhiều từ đang sử dụng được ánh xạ trên cùng 
một khe. Mục tiêu cuối cùng là để cải thiện hiệu suất. 

Phương pháp để giải quyết khó khăn này là mở rộng direct- 
mapped cache để có nhiều hơn 1 điểm nhập cho mỗi khe. Máy PDP- 
11/70 có 2 điểm nhập cho một khe. Một dỉrect-mapped cache vơi 
nhiều điểm nhập cho một khe được gọi là set associative cache và 
được minh họa trong hình 4.30. 

Thực ra cả 2 loại associative cache và direct-mapped cache đều 
là những trường hợp đặc biệt của loại set associatiưe cache. Nếu 
giảm sô' khe xuông 1, tất cả điểm nhập của cache đều ớ trong cùng 
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khe, và chúng ta phải phân biệt chúng hoàn toàn bằng các Tag của 
chúng vì tất cả được ánh xạ trên cùng một địa chỉ. Trường hợp này 
chính là associative cache. Nếu n = 1 , ta có trở lại direct-mapped 
cache với 1 điểm nhập cho mỗi khe. 


Entry 0 Entry 1 Entry n-1 


Slot Valld Tag Value 



Hình 4.30 Một seỉ associative cache với n điểm nhập cho mỗi khe 

Associative và direct-mapped cache có các điểm mạnh và điểm 
yếu khác nhau. Direct-mapped cacke đơn giản hơn, rẻ hơn trong 
thiêt kế và có thời gian truy xuất nhanh hơn vì khe thích hợp có 
thể tìm thấy bằng cách tạo chỉ sô trong cache, sử dụng một phần 
địa chỉ làm chỉ số. Associative cache có tỉ lệ thành công ( hit ratio ) 
cao hơn với sô' khe bất kỳ vì không bao giờ có xung đột. Không thể 
xảy ra trường hợp k từ quan trọng không được đưa vào cache đồng 
thời do bởi chúng gặp vận rủi khỉ ánh xạ trên cùng một khe của 
cache. Khi một máy tính thực bất kỳ được thiết kế, người ta luôn 
tạo ra một sự mô phỏng cache mở rộng để xem hiệu suất và giá 
thành của máy. 

Ngoài việc xác định số khe, các nhà thiết kế cũng phải chọn 
kích thước khối. Trong thí dụ để đơn giản ta đà dùng một từ 32-bit, 
nhưng 2, 4, 8 hoặc nhiều từ hơn cũng có thể và thường được sử 
dụng. Thuận lợi của việc dùng kích thước khối lớn là tổng thời gian 
tìm nạp một sô' khối 8-từ nhỏ hơn tổng thời gian tìm nạp 8 khối 1- 
từ, dặc biệt là nếu bus cho phép chuyển những khối dừ liệu. Có 
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điểm bất lợi là không phải tất cả các từ đều cần thiết, vì thế một 
số thao tác tìm nạp sẽ phí phạm. 

Một vấn đề quan trọng khác trong thiết kế cache là làm thế nào 
để điều khiển ghi. Có 2 phương pháp thường được sử dụng. Phương 
pháp thứ nhất, gọi là Lưrite through , khi ghi một từ vào cache, từ 
này cùng tức thời dược ghi trở lại bộ nhớ chính. Phương pháp này 
bảo đảm rằng các điếm nhập cúa cache luôn luôn giống như các 
điểm nhập tương ứng cửa bộ nhớ. 

Một phương pháp ghi khác, gọi là copy back , không cập nhật 
vào bộ nhớ chính mỗi khi cache bị thay đổi. Thay vào đó, bộ nhớ 
chỉ được cập nhật khi điểm nhập bị loại bỏ khói cache đê cho phép 
một điểm nhập khác chiêm khe. Khi sứ dụng copy back , cần có 1 
trong mỗi điểm nhập của cache đề cho biết có phải điếm nhập cùa 
cache bị thay đối từ khi được nạp vào cache. 

Như vậy tất cá khía cạnh khác của vấn đề thiết kê cache, đều 
có các thỏa hiệp ơ dây. Rõ ràng là ivrite through làm cho lưu lượng 
sử dụng bus nhiều hơn so với copy back. Mặt khác, nếu một CPU 
bắt đầu thao tác truyền I/O từ bộ nhớ vào đĩa, và nội dung bộ nhớ 
không đúng ( bởi vì những từ mới thay đối gần đây chưa được sao 
chép ngược trở lại vào bộ nhớ từ cache ), dữ liệu không đúng sẽ 
được ghi lên đĩa. Vân đề này có thể tránh được nhưng lại làm tăng 
thêm tính phức tạp cho hệ thống. 

Nếu tỉ lệ giữa việc đọc và việc ghi rất cao, đơn giản nhất là sử 
dụng write through và chấp nhận toàn bộ lưu lượng của bus. Tuy 
nhiên, nếu có nhiều thao tác ghi, tôt hơn là dùng copy back và có vi 
chương trình loại bỏ dứt khoát toàn bộ cache trước khi bắt đầu một 
thao tác I/O. 


Một vân đề thiết kế khác liên quan đến các thao tác ghi là phái 
làm gì nếu thao tác ghi gây ra một thất bại trên cache ( cache 
miss ). Phương pháp khắc phục là tìm nạp từ đó vào cache và sau 
đó cập nhật, ghi trở lại nếu đang sử dụng write through. Một 
phương pháp khác là ghi trực tiếp vào bộ nhớ, nhưng không tìm 
nạp từ vào cache ngoại trừ các thao tác đọc. Vấn đề này được gọi là 
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write aỉlocation poỉicy. Cả 2 phương pháp mô tả ở đây đều được sử 
dụng. 

Với công nghệ mạch tích hợp được cải tiến, ta có thể đặt mọi 
cache có tốc độ truy xuất rất nhanh ngay trẽn chip CPU. Những 
cache này nhỏ, do thiếu vùng chip, nên người ta muốn có những 
caches 2 cấp t 2 level cache ), 1 cache trên chip CPU và 1 cache 
trên board CPU. Nếu không thể tìm thây một từ nào trong cache 
trên chip CPU. Nếu một từ không được tìm thấy trong cache trên 
chip, 1 yêu cầu được tạo ra để tìm trong cache trên board. Nếu kết 
quá tim cũng thât bại, bộ nhớ chính được sử dụng. 

Mọi vân đề đã được xem xét, việc truy xuất nhanh là một kỹ 
thuật quan trọng đế cái tiến hiệu suất. Gần như những máy tính cỡ 
trung và lớn đều dùng một dạng truy xuất nhanh nào đó. Thông tin 
thêm về cache có thế tìm thấy trong ( Hill, 1988 ; Przybylski et al., 
1988 ; Short and Levy, 1988 ; và Smith, 1986, 1987). 

4.6 CÁC THÍ DỤ VỂ CẤP VI LẬP TRÌNH 

Trong phần này chúng ta sẽ xem xét 2 thí dụ về câp vi lập 
trình, họ Intel và Motorola. Hai họ này cần được làm rõ bởi vì 
những máy tính trong thực tế rất phức tạp. Trong cả 2 trường hợp, 
chúng ta đều khẩo sát một thành viên đơn giản của mỗi họ để 
tránh những chi tiết không cần thiết. 

4.6.1 Vi cấu trúc của 8088 họ Intel 

Vi câu trúc của tất cả các CPU của Intel là giông nhau bởi vì 
chúng được phát triển từ CPU đầu tiên, 8086 ( McKevitt and 
Bayliss, 1979 ). 8088 gần giông với 8086, chỉ khác là 8088 có một 
giao tiếp bus 8-bit thay vì một giao tiếp 16-bit. Đường dữ liệu, ALƯ 
và bộ nhớ nháp thanh ghi giống hệt nhau. Tương tự, 80286 cũng 
không thay đổi đối với đường dữ liệu chính, bởi vì giông như 2 bộ 
xử lý trước, 80286 cũng là một CPU có 16-bit bên trong. Tuy nhiên, 
80286 bao gồm 4 đơn vị đa chức năng độc lập như đã trình bày 
trong chương 3. 80386 có một đường dừ liệu 32-bit và 8 khối chức 
năng, vì thế hơi khác với những chip kia. 

Chúng ta sẽ tập trung vào 8088 vì đây lặ thành viên dơn giản 
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nhất của họ Intel, nhưng các chip khác cũng tương tự dù có một số 
chi tiết khác. 8088 sử dụng sự pha trộn cùa vi mã và logic ngẫu 
nhiên ( đặc trưng hóa các mạch phần cứng ) đế cung cấp tính năng 
tốt trong khi giảm thiểu kích thước của vi mã. Các vi lệnh có khuôn 
dạng dọc với các trường đa bít chỉ rõ các chức năng chung hơn là 
các bit đơn điều khiển các cổng riêng trong đường dữ liệu. 

Trung tâm chính của 8088 là đường dữ liệu chính, được minh 
họa ở dạng đã được đơn giản trong chương 3. Đường dữ liệu có 2 
phần, phần thâp ở nửa dưới của hình vẽ và phần cao ờ nứa trẽn. 
Hai phần này hoạt động độc lập và song song nhau. 

Phần thấp có thể so sánh với đường dữ liệu trong hầu hết các 
máy tính khác, kể cả các thí dụ của chúng ta. Đường dử liệu chứa 
một ALƯ da chức năng, lấy dữ liệu ở 2 ngõ vào đế thực hiện một 
chức năng đơn gián và tạo ra một ngõ ra. Các ngõ vào đến từ 3 
thanh ghi 16-bit, TMPA, TMPB và TMPC, chúng được nạp trước 
chu kỳ cúa ALU. Ngõ ra nôi đến ALƯ bus, từ đáy được dần đường 
trở lại vào một trong 3 thanh ghi nhập hoặc một nơi nào khác 
trong đường dữ liệu. ALƯ có thế thực hiện được các thao tác với dừ 
liệu 8-bit và 16-bit. Các mã điều kiện sinh ra từ 1 thao tác của 
ALƯ có thể dược chứa trong từ trạng thái chương trình PSW dưới 
sự điều khiến của vi chương trình. 

Phần thấp của đường dữ liệu cũng chứa một bộ nhớ nháp 8-từ 
bao gồm AX, BX, cx, DX, SI, DI, BP và SP. Một thanh ghi có thể 
được sao chép từ bộ nhớ nháp tới ALƯ bus và từ đó tới một trong 
các thanh ghi tạm, tại đây được sử dụng như một ngõ vào của ALƯ. 
Ngõ ra của ALƯ có thể được dẫn đường trực tiếp tớibộ nhớ nháp, 
không phải qua một thanh ghi TMP. 

Khôi có đánh dâu chéo giữa bộ nhớ nháp và ALƯ bus có 
khả năng trao đổi các byte như thể sao chép theo cả 2 hướng. Đặc 
tính này cần dùng để truy xuâT những thanh ghi 8-bit trongbộ nhớ 
nháp. Thí dụ, để cộng AL với BH, có thể sao chép AX vào TMPA. 
Sau đó BX được sao chép vào TMPB, thao tác trao đổi các byte được 
tiến hành, vì vậy BH chiếm byte thấp của TMPB và BL chiếm byte 
cao của TMPB. Sau đó phép cộng 8-bit cộng AX với BH, tổng của 
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chúng được dần đường quay trở lại hoặc AL hoặc BH, tùy thuộc vào 
chỉ thị. 

Phần trẽn của đường dữ liệu liên quan đến việc tính địa chỉ. 
Trong 8088, địa chi vật ỉý bộ nhớ được hình thành bằng cách cộng 
một địa chi 16-bit với thanh ghi đoạn thích hợp để tạo ra một địa 
chỉ vật lý 20-bit đưa lên bus địa chỉ. Phần trên của đường dữ liệu 
chứa bộ nhớ nháp dạng thanh ghi bao gồm 4 thanh ghi segment, bộ 
đếm chương trình và 2 thanh ghi lưu giữ. Bộ nhớ nháp cũng bao 
gồm hàng đợi tìm nạp trước ( preíetch queue ) như mô tả dưới dây. 

Phần trên của đường dữ liệu chứa một bộ cộng dùng để kết hợp 
các offset 16-bit với các thanh ghi scgment. Phần này cũng được nối 
dây sao cho 4 bit thấp của offset đến trực tiếp tới bus địa chỉ, không 
qua bộ cộng, ngược lại các bit từ 4 tới 15 của offset được cộng với 
các bit từ 0 tới 11 của thanh ghi segment để hình thành 16 bit cao 
của địa chỉ bus. Một ROM dung lượng nhỏ chứa các hằng sô" thông 
thường, thí dụ, đế cộng 1 với bộ đếm chương trình sau khi có 1 byte 
được tìm nạp từ bộ nhớ. 

8088 được thiết kế đề xử lý chỉ thị theo kiểu đường ống. Có 4 
đơn vị hiện diện đế tìm nạp trước chi thị, giải mã chỉ thị, thực hiện 
việc tính toán địa chỉ và thực thi chỉ thị. 3 đơn vị sau tương dôi 
theo qui ước, nhưng bộ tìm nạp trước ( prefetcher ) không thường 
được sử dụng. Bộ này hoạt động hoàn toàn độc lập với phần còn lại 
của bộ xử lý. Bất cứ khi nào bus rảnh, bộ tìm nạp trước phát một 
yêu cầu bộ nhớ để đọc byte kế tiếp trong luồng chỉ thị. Việc đọc các 
byte được đệm trong một hàng đợi trong bộ nhớ nháp ở phần trên. 
Khi cần một byte của chỉ thị mới, byte này được lấy ra từ hàng đợi. 

Kích thước của hàng đợi là một thông số thiết kế thú vị. Nếu 
quá nhỏ, CPU sẽ thường xuyên chờ 1 byte từ bộ nhớ. Tuy nhiên, 
quá lớn cũng không tốt. Bộ tìm nạp trước không các byte tìm nạp 
có nghĩa là gì, bộ này chỉ tìm nạp byte kế tiếp miễn là có một chỗ 
trống trong hàng đợi. Đặc biệt, sau một chỉ thị nhảy, ngay cả chỉ 
thị nhảy không điều kiện, bộ tìm nạp trước tiếp tục công việc tìm 
nạp trước các byte sẽ không được sử dụng. Nếu hàng đợi quá lớn, 
. bộ tìm nạp sẽ làm lãng phí đáng kể băng thông của bus do việc tìm 






Chương 4: Cấp vi lập trình 


265 (MỊ 


o 

1 

« 


ậ 

Q. 


Seqment 

reglsters 


InsUuctlon 
queue 



All bus 


Matn 
register • 
scratchpad 





A 

X 


B 

X 


c 

X 


D 

X 


SP 


BP 


SI 


DI 


Cross 


o 

o 

jf 

(0 


ĩ 

ộ 



TMPA 


TMPC 


Y” : "V : 


TMPB 





w 


ALU 


-AL.U 

Controt 


- 


Ị 



M O, 

Conditlon codes Ị 


Hình 4.31 Giản đồ được đơn gián hóa của đường dữ liệu của 8088 
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To bus : đến bus 
Temp : thanh ghi tạm 
Adder : bộ cộng 
Operand : toán hạng 

TMPA, TMPB, TMPC : các thanh ghi tạm 
Segment registers : các thanh ghi segment 
Instruction queue : hàng đợi chi thị 
Indirect : gián tiếp 
ALU bus : bus cựa ALU 

Main register scratchpad : bộ nhớ nháp chính dạng thanh ghi 
ALƯ control : điểu khiến ALU 
Condition codes : các mà điều kiện 

nạp các byte sau các chi thị nhảy. 8086 có 1 hàng đợi 6 byte. nhưng 
với 8088 hàng đợi chí có 4 byte. 

Ngoài đường dữ liệu, 8088 còn có một khối điều khiển chưa vi 
chương trình và điều khiên đường dữ liệu ( xem hình 4.32 ). Khi bắt 
đầu một chỉ thị mới của câp máy qui ước, byte opcode của chí thị 
được lây ra khỏi hàng đợi chỉ thị và được nạp vào thanh ghi chỉ thị 
IR t instrurtion register ). 


N 


Byte/word 



Hình 4.32 Sơ đồ đơn giản cửa phần điều khiển 8088 theo thiết kế dọc. 
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From instruction queue : từ hàng đợi chỉ thị 

Subroutine return register : thanh ghi trồ về chương trình con 

Translation ROM : ROM dịch 

Group decode : giải mã nhóm 

Control store : bộ nhớ điều khiển 

To ALU control : đến điều khiển ALƯ 

ưsed to locate starting address in the control store : dùng đế định vị địa 
chỉ bắt đầu trong bộ nhớ điều khiển 
Byte/word : byte/từ 


Đơn vị phần cứng có tên ỉ à giải mã nhóm ( group decode ) trong 
hình 4.32 lấy thông tin từ IR và đưa tới khắp các khỏi trong máy. 
Các thanh ghi M và N nhận các trường được dùng trong việc tính 
địa chỉ của toán hạng nguồn và toán hạng đích. Thanh ghi X chứa 
thông tin của opcode được dùng để báo cho ALƯ biết chức năng nào 
được thực hiện. Đơn vị giải má nhóm cũng lấy bit bytehoord từ 
opcode. Bit này điều khiến các thao tác của ALƯ hoặc trên 8 bit 
hoặc trên 16 bit và truyền thông tin với bộ nhớ nháp hoặc trên 8 
bit hoặc trên 16 bit. 

Các vi lệnh có độ rộng 21 bit. Tổng cộng có 504 vi lệnh cần 
dùng được chứa trong một ROM 504 X 21. Khi tìm nạp một chỉ thị 
máy, một PLA chuyển dối opcode thành địa chỉ khới đầu của vi mả 
điều khiển chỉ thị đó. Không giông như trong các thí dụ của chúng 
ta, trong đó các chỉ thị được kiểm tra từng bit một, ở đây không có 
phần mềm giải mã. Việc giải mã được thực hiện hoàn toàn bằng 
phần cứng để tiết kiệm thời gian. 

Vi mã được chia ra thành những burst hay sequence ( dãy ) lên 
đến 16 vi lệnh, mỗi burst điều khiển một hoặc nhiều chỉ thị máy 
hoặc cung cấp một thủ tục phục vụ thông thường như tính địa chỉ. 
Có 2 loại vi lệnh nhảy ( microjump ) : vi lệnh nhảy ngắn ( short ), 
thực hiện việc nhảy trong burst hiện tại ( địa chi 4-bit ) và vi lệnh 
nhảy dài ( long ), thực hiện việc nhảy tới bât cứ nơi nào trong vi 
chương trinh. Các vi lệnh gọi vi thử tục ( microprocedure ) củng 
hiện hữu và hoạt động tương tự như vi lệnh nhảy dài, chỉ khác là 
chúng gửi địa chỉ trở về vào thanh ghi SR ( subroutine return ). Các 
vi thủ tục không được lồng vào nhau. ROM 504-từ chứa khoảng 90 
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burst, trung bình có 5 hoặc 6 từ mỗi burst. 

Phương pháp chưng để phiên dịch các chỉ thị sô" học và logic như 
sau. Trước tiên một vi thu tục được gọi để thực hiện việc tính địa 
chỉ. Mã này sử dụng các thanh ghi M và N đã chứa các trường 
thanh ghi nguồn và đích, ở nơi thích hợp. Khi vi thủ tục tính địa 
chỉ trở về, các toán hạng có giá trị sử dụng trong các vị trí cô" định, 
và thanh ghi X chứa mã cúa ALƯ cho chỉ thị máy này ( đặt ở đó 
bằng phần cứng ). Thù tục chính bây giờ thực hiện 1 chu kỳ đường 
dừ liệu, với các toán hạng và mã chức năng của ALƯ đến từ các 
thanh ghi. Thu tục này thậm chí không cần biết thao tác gì dang 
được thực hiện. Trong phương pháp này, các chỉ thị ADD, SƯB, 
AND, OR và một vài chỉ thị khác có thể dùng chung một vi mã mặc 
dù chúng thực hiện những thao tác khác nhau. Dĩ nhiên, các chỉ thị 
PƯSH, CALL và JMP hoàn toàn khác nhau và mỗi chỉ thị cần một 
vi mã riêng. 

Một vi lệnh tiêu biểu của 8088 được trình bày trong hình 4.33 
(a). Vi lệnh có 2 phần hoạt động song song với nhau. Phần bên trái 
chứa 2 trường 5-bit cho phép mọi vi lệnh thực hiện chuyển dữ liệu 
từ thanh ghi tới thanh ghi. 32 thanh ghi có thể được dùng như 
thanh ghi nguồn và thanh ghi đích, đó là các thanh ghi 8-bit và 
16-bit trong 2 bộ nhớ nháp và các thanh ghi tạm. 


Blts 

5 

5 
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4 

3 1 


SRC 

OEST 


ALU 

REG rf 


' 7 ' 


TYPE cc 


ALU operaỉion 
Memory operatíon 
Short ịúmp 
Long ỉump 
Microprocedure call 
Bookkeeping 


(a) 


(b) 


Hình 4.33 (a) Dạng vi lệnh của ALƯ 8088 (b) Các loại vi lệnh 

ALƯ operation : thao tác ALU 
Memory operation : thao tác bộ nhớ 
Short jump : nháy ngắn 
Longjump : nháy dài 
Microprocedure call : gọi vi thủ tục 
Bookeeping : kết toán 
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Phần bên phải là một vi lệnh mã hóa dọc ( vertical-encoded 
microinstruction ) 11-bit gồm các trường loại vi lệnh, mã ALƯ, 
thanh ghi và mã điều kiện. Có 6 loại vi lệnh được liệt kê trong 
hình 4.33(b). Chúng được phân biệt bởi trường TYPE. Tất cả vi 
lệnh đều có 10 bit để di chuyển từ thanh ghi nguồn tới thanh ghi 
đích, nhưng khuôn dạng của 11 bit thấp hơi khác giữa loại này với 
loại kia. 

Mã ALƯ có thể ra lệnh thực hiện một chức năng đặc biệt hoặc 
chỉ thị cho ALU sử dụng mã trong thanh ghi X. Trường thanh ghi 
3-bit cung cáp toán hạng và bit cuối cùng cho biết các mã điều kiện 
có được thiết lập hay không. Mỗi chỉ thị thực hiện trong một chu kỳ 
xung clock đơn, vì thế nó không thể di chuyển một giá trị từ bộ nhớ 
nháp vào một thanh ghi TMP và sau đó dùng thanh ghi này như là 
một toán hạng của ALƯ trong cùng một chu kỳ. 

Các vi lệnh gọi vi thủ tục và vi lệnh nhảy dài đưa ra một vân 
đề, chúng cần nhiều bit hơn để chỉ rõ đích trong vi lệnh. Cách giải 
quyết là dùng 1 ROM dịch ( translation ROM ) ánh xạ các địa chỉ 5- 
bit lên toàn bộ các địa chỉ của vi chương trình. Các vi lệnh gọi và 
nhảy dài dùng các địa chỉ 5-bit để cho biết đích mà chúng muốn. Dì 
nhiên, phương pháp này có nghĩa là chỉ có 32 địa chỉ được nhảy tới 
hoặc được gọi, và như thế là đủ. 

4.6.2 Vi cấu trúc 68000 của Motorola 

Một thí dụ thứ 2 về vi cấu trúc trong một máy thực tê, chip 
Motorola 68000 ( Stritter and Tredenick, 1978 ). 68000 là một chip 
hơi lớn hơn 8088 có không gian chứa được 68000 transistor bên 
trong ( 68000 được dùng để đặt tên ), mặc dù chỉ sử dụng khoảng 
40000, phần còn lại của không gian bị chiếm bởi các đường kêt nôi 
và v.v... 

Trước đây chúng ta đã đề cập đến vấn đề 68000 là một CPU 16- 
bit hay 32-bit. Câu hỏi dó lại xuât hiện lần nữa trong vi cấu trúc. 
Đường dữ liệu chính được trình bày trong hình 4.34. 
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Hình 4.34 Giản đồ đã được đơn giản của đường dừ liẹu của 68000 
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Như ta thấy, thực tế đường dử liệu gồm 3 đường dừ liệu rộng 16- 
bit, mỗi đường có thẻ hoạt động độc lập với những đường kia và 
chúng hoạt động song song nhau. Phần bên trái điều khiến việc 
tính toán 16 bit cao của địa chi. Phần ớ giữa điều khiên việc tính 
toán 16 bit thâp của địa chỉ. Phần bên phải thực hiện các thao tác 
trên dữ liệu. 

Mỗi phần có 2 bus lấy dữ liệu từ thanh ghi và đưa chúng cho bộ 
cộng hoặc ALƯ. Các bus cũng được dùng đề dưa kết quá ỡ ngõ ra 
của ALU trở lại các thanh ghi. ơ phía trên cùa mỗi bus trong 6 bus 
là một chuyên mạch được mở hoặc đóng nhờ vào phần mềm. Bằng 
cách mở các chuyển mạch, các bus được kết nối về mặt điện. Thí dụ 
nếu cả 6 chuyên mạch được mớ, các thanh ghi ở phần bên trái có 
thể dược dùng như các toán hạng cho ALƯ ở phần bên phải. 

Ta hày xét các thanh ghi, bắt đầu từ bên trái. Khối đánh dấu 
DO - D7 HIGH chứa 16 bit cao của 8 thanh ghi dừ liệu. Khối dưới 
chứa 16 bit cao của 8 thanh ghi địa chì. Kế tiếp là con trỏ stack chê 
độ giám sát ( supervisor mode stack pointer ); 2 thanh ghi nháp : 
thanh ghi nháp dừ liệu tạm thời DT ( data temporary ) và thanh 
ghi nháp địa chỉ tạm thời AT ( address temporary ); nữa cao của bộ 
đếm chương trình. Tât cả 20 thanh ghi này có thế được dưa lên bus 
trái hoặc bus phải, quyết định bởi vi chương trình. 

Cả 2 bus đều dẫn đến bộ. cộng 16-bit. Bộ cộng không phải là 
một ALƯ, chỉ có thể thực hiện phép cộng. Vì chủ yếu bộ cộng này 
được dùng để tính địa chỉ, không cần có khả năng thực hiện một 
thao tác nào khác nên nếu thiêt kê một ALƯ sẽ phải tôn nhiều 
vùng chip. Lưu ý là ngõ vào bên trái bộ cộng là mạch chọn kênh, có 
thể chọn hoặc bus bên trái hoặc phần cao của ROM hằng sỏ 
( constant ROM ), cũng dưới sự điều khién của vi chương trình. 

Ngõ ra của ALU được chốt và có thế đưa lẽn cả 2 bus, do vậy các 
kết quả có thê được chứa trong các thanh ghi. Ngoài ra, mạch chôt 
còn có thể điều khiến bus địa chỉ bên ngoài để xuât nửa cao của 
một địa chỉ bộ nhớ 32-bit. 

Về cơ.bản phần giữa sơ đồ cũng tương tự, nhưng không chứa bộ 
nhớ nháp dữ liệu hoặc thanh ghi DT. Dĩ nhiên ROM hằng số chứa 
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16 bit thâp của các hằng sô", không phải các bit cao. Ngõ ra của 
mạch chốt có thể điều khiển địa chỉ thấp của bus. Cả 2 phần đều có 
thế được phép đồng thời nên một dịa chỉ đầy đủ 32-bit có thể được 
đặt lên bus bộ nhớ. 

Phần bên phải tương tự như 2 phần kia, chứa phần thâp của bộ 
nhớ nháp dữ liệu và phần thảp của DT. Phần này cũng có một 
ROM hằng số mặc dù ROM này ở trên bus khác và chứa các hằng 
sô khác nhau ( tuy nhiên vẫn tương tự nhau về ý tưởng ). 

Có 3 đặc tính mới xuât hiện ở đây. Trước tiên, bộ cộng được 
thay bằng một ALƯ đầy đủ chức năng để thực hiện các phép toán 
sô học và logic trên các thanh ghi D. Vì ALƯ chỉ rộng 16 bit nên 
các phép toán 32-bit cần 2 chu kỳ đường dữ liệu. Thứ hai, có thêm 
một thanh ghi nháp phụ cần dùng cho các phép nhân và chia. Thứ 
ba, không giông như 2 phần kia, không những phần này có thể gửi 
kết quả ở ngõ ra lên bus dữ liệu mà còn có thể nhận dữ liệu đến. 

Tuy không được trình bày trong hình vẽ, nhưng cần lưu ý, một 
bộ 3 thanh ghi chỉ thị chứa những lệnh mới đến. Cần phải có cả 3 
thanh ghi vì 68000 xử lý lệnh theo kiểu đường ông. Thanh ghi dầu 
tiên chứa chỉ thị đang được thực hiện; thanh ghi thứ 2 chứa chỉ thị 
đang được giải mã ; thanh ghi thứ 3 chứa chỉ thị đang được tìm nạp 
từ bộ nhớ. 

Thực tế việc giao tiếp với bus dữ liệu thực hiện nhờ các chuyển 
mạch hai chiều ( cũng không được trình bày trong hình vè ), giống 
như 8088, vì vậy các byte cao và thấp của 1 từ 16-bit có thể được 
trao đổi khi chúng đi tới bus dữ liệu hoặc từ bus dữ liệu đến. Cần có 
tiện ích này để dịa chỉ hóa và thao tác với các byte riêng rẽ. 

68000 sử dụng một bộ nhớ điều khiển 2 cấp, vái một vi chương 
trình và một chương trình nano, như trình bày trong hình 4.35. Các 
chi tiết có hơi khác so với thí dụ trong sách nhưng mục tiêu lại 
giông nhau : giảm sô' bit trong bộ nhớ điều khiển bằng cách có một 
vi chương trình xác định chuỗi chỉ thị nano đươc thưc hiện, và thưc 
tế có các chỉ thị nano điều khiển các cổng trong các đường dữ liệu. 
Vi chương trình gồm có 544 từ 17-bit và chương .trình nano có 336 
từ 68-bit, tổng cộng là 32096 bít. Việc hiện thực bộ nhớ 1 cấp với 
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544 từ 68-bit sẽ cân 36392 bit, tĩêt kiệm được 13%. Vì chip này đã 
thúc đẩy tình trạng phát triển hiện tại của kỹ thuật thiết kế một 
cách rõ ràng với giới hạn tối đa khi được đưa ra, việc tiết kiệm bộ 
nhớ được xem là đáng kể. Để so sánh, ta nhớ lại vi chương trình 
504 từ 21-bit của 8088 chứa 10584 bit. 


MlcroROM NanoROM 


17-Btts-^ -68-Blts-► 



Hình 4.35 68000 có một bộ nhớ điều khiển 2 cấp với 1 microROM và 1 

na no ROM 

MicroROM : ROM chứa vi chương trình 
NanoROM : ROM chứa chương trình nano 

544 17-bit words actually used : 544 từ 17-bit thực sự được dùng 
336 68-bit words actually used : 336 từ 68-bit thực sự được dùng 

Các ROM cho cả vi chương trình và chương trình nano được địa 
chỉ hóa bằng các sô" 10-bit, cung cấp 1024 điểm nhập cho mỗi ROM, 
trong khi chỉ cần 544 điểm nhập cho vi chương trình và 336 điểm 
nhập cho chương trình nano. Trong cả 2 trường hợp, các điểm nhập 
được đặt khắp nơi trong không gian dịa chỉ theo một phương pháp 
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rất cẩn thận. Trong lập trình nano qui ước, trước tiên phần cứng 
tìm nạp 1 vi lệnh, vi lệnh này chứa địa chỉ của chỉ thị nano. Sau đó 
chỉ thị nano được tìm nạp và thực hiện. Quá trình vốn có 2 giai 
đoạn, vì chỉ thị nano không thê được tìm nạp cho tới khi vi lệnh có 
giá trị sử dụng. 

Các nhà thiết kế 68000 thích ý tưởng tiết kiệm vùng chip bằng 
cách dùng phương pháp lập trình nano nhưng không thích ý tưởng 
làm giám tốc độ máy bằng cách phái đợi cho tới khi vi lệnh có thể 
sứ dụng được trước khi bắt đầu tìm nạp chỉ thị nano. Do đó họ đã 
dùng một kỹ thuật dặc biệt đế thực hiện mọi công việc trong 1 chu 
kỳ. Trong hầu hết trường hợp, chí thị nano tương ứng với vi lệnh ở 
địa chỉ n cũng có địa chỉ là n , do vậy chúng có thể được tìm nạp 
đồng thời. 

Trong những trường hợp mà chỉ thị nano được dùng chung giữa 

2 hay nhiều vi lệnh, 1 transitor bị loại bỏ khỏi mạch giái mă chỉ thị 

nano để ánh xạ 2 hay nhiều địa chỉ trên cùng một từ. Thí dụ địa chỉ 

0000011111 được ánh xạ trên địa chỉ 0000010111 bằng cách xóa đi 

1 transistor, vì thế các vi lệnh ờ cả 2 địa chỉ 31 và 23 đều sử dụng 

chỉ thị nano 23. Dĩ nhiên, chọn lựa chính xác lệnh nào ở đâu là 
* * « • • 

điều hét sức khó khàn. Những người thiết kê có các máy tính giúp 
họ đưa những vấn đề khó giái quyết này lại với nhau. 

Có 2 khuôn dạng vi lệnh được dùng trong 68000. Cả 2 được 
trình bày trong hình 4.36. Các vi lệnh không được thực hiện tuần 
tự như trên 8088. Thay vào đó, mồi vi lệnh đều có nêu rõ vi lệnh sẽ 
đến sau nó, Nhu cầu phái có nhừng vi lệnh cụ thể ánh xạ trên các 
chỉ thị nano cụ thê được trình bày trong sơ đồ này. 

Dạng 1 được dùng cho tất cá vi lệnh ngoại trừ vi lệnh nhảy có 
điều kiện. Dạng 2 được dùng cho vi lệnh nháy có điều kiện. Cả 2 
dạng đều có 1 bit được dùng để bắt đầu tìm nạp trước chỉ thị kế 
tiếp, và cả 2 đều có 2 bit ớ trường FC dùng để xuất tín hiệu đến các 
chân của chip, báo cho 68000 biết có phải việc tham chiếu bộ nhớ ở 
vùng lệnh, hoặc vùng dữ liệu, hoặc trả lời ngắt hoặc không làm gì 
cả. Các vi lệnh dạng 1 có vài bit linh tinh và 1 địa chỉ 10-bit cho 
biết nơi tìm nạp vi lệnh kế tiếp. 
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Các vi lệnh dạng 2 có 1 trường 5-bit để chọn một trong 32 điều 
kiện được kiểm tra, như là các mã điều kiện và các bit trong thanh 
ghi chỉ thị. Kết quả kiếm tra sinh ra 2 bit, 2 bít này được kết hợp 
với 8 bit trong vi lệnh dể chọn 1 trong 4 vi lệnh theo sau. 
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Hình 4.36 Các khuôn dạng vi lệnh cùa 68000 

Các chỉ thị nano 68-bit được mã hóa ngang với 38 trường phân 
biệt, hầu hết đều có 1 hoặc 2 bít. Các trường điều khiến việc đưa tát 
cả các thanh ghi và các bộ nhớ nháp lên các bus, lựa chọn thanh 
ghi, điều khiển chuyển mạch, thiết lập các mả điều kiện, hàm ALƯ, 
sử dụng các ROM hằng sô' và các mạch chọn kênh, các thao tác bộ 
nhớ, đây là lý do tại sao các chỉ thị nano cần quá nhiều bit. 

4.7 TÓM TẮT 

ở cấp vi lập trình, CPU có 2 thành phần chính : đường dữ liệu 
và phần điều khiển. Đường dữ liệu chủ yếu có 1 bộ nhớ nháp và 
phần của ALƯ / mạch dịch bit. Một chu kỳ bao gồm việc lây các 
toán hạng từ bộ nhớ nháp, đưa chúng vào ALƯ / mạch dịch bit và 
có thể chứa kết quả trở lại vào bộ nhớ nháp. 

Phần điều khiển chứa bộ nhớ điều khiển, nơi lưu giữ vi chương 
trình. Mỗi vi lệnh trong bộ nhớ điều khiển sẽ điều khiên các cổng 
trên đường dữ liệu trong một vi chu kỳ. Trong thí dụ đã cho, các vi 
chu kỳ được chia thành các chu kỳ con được điều khiến bởi một 
mạch tạo xung clock. Trong chu kỳ con 1, vi lệnh dược tìm nạp từ 
bộ nhớ điều khiển và đưa vào 1 thanh ghi nội. Trong chu kỳ con 2, 
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các ngõ vào của ALU được chôt lại để ổn định dữ liệu trong suôt vi 
lệnh đó. Trong chu kỳ con 3, ALU và mạch dịch bít thực hiện công 
việc của chúng. Cuối cùng trong chu kỳ con 4, kết quả có thể được 
đưa trờ lại vào bộ nhớ nháp nếu cần dùng cho vi lệnh kế tiếp. 

Không nhiều máy có một bộ đếm chương trình rõ ràng ở cấp vi 
lập trình. Thay vào đó, các vi lệnh thường chứa địa chỉ nền của các 
vi lệnh kế tiếp. Điển hình là địa chỉ nền này được OR với một sô' 
bit trạng thái để sinh ra địa chỉ cuối cùng. Trẽn nhiều máy, địa chỉ 
nền từ một vi lệnh được kết hợp với các bit trạng thái sinh ra từ vi 
lệnh trước để tạo ra một địa chỉ nhảy không có hiệu lực cho tới khi 
có vi lệnh sau. 

Các vi lệnh được tổ chức ngang, mỗi tín hiệu điều khiển có 1 bit 
( theo kiểu dọc ), có một sô' trường cần giải mã phức tạp, hoặc dại 
loại như vậy. Tố chức ngang dần đến các từ dài và các máy song 
song, tốc độ nhanh. Tố chức dọc dẫn đến các máy có tốc độ chậm 
hơn và các bộ nhớ điều khiến nhỏ hơn. 

Hiệu suất được cải thiện bằng cách nhiều kỷ thuật khác nhau. 
Một trong những kỹ thuật này là lập trình nano, trong đó vi chương 
trình chứa các con trỏ ( ngắn ) tới các chỉ thị nano ( dài ) thực tế để 
điều khiến các cổng. Lập trình nano làm giám một lượng không 
gian chip đáng kể đế dành chỗ cho các ROM với giá phải trả là tốc 
độ thực thi sẽ chậm hơn. 

Các phương pháp khác đế cải tiến hiệu suất là thay đổi thời 
gian của chu kỳ, rẽ nhánh nhiều đường, sử dụng đường ông và bộ 
nhớ truy cập nhanh. Tuy nhiên, mỗi kỹ thuật đều kèm theo một số 
vân đề phức tạp. 

Cuối cùng, các vi câu trúc của 2 chip 8088 và 68000 được thảo 
luận. 8088 có 1 đường dừ liệu truyền thông, được tăng lên bằng 
phần trên dể thực hiện tính toán trên các thanh ghi segment. 8088 
dùng các vi lệnh dọc 21-bit. 68000 có 3 đường dữ liệu 16-bit độc lập, 
2 đường cho địa chỉ và 1 đường cho dữ liệu. Một bộ nhớ điều khiển 
2 cấp với các vi ìệnh 17-bit và các chỉ thị nano ngang 68-bit. 





Chương 5: Cấp máy qui ước 
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Chương này giới thiệu cấp máy qui ước ( cấp 2 ) và thảo luận 
nhiều khía cạnh về cấu trúc của cấp này. Theo lịch sử, ngôn ngữ 
máy cấp 2 được phát triển trước bất kỳ một ngôn ngữ máy nào 
khác và vẫn được xem là một ngôn ngữ máy phố biến. Do bởi trên 
nhiều máy, vi chương trình được đặt trong bộ nhớ chỉ đọc, người sử 
dụng ( không phải người chê tạo máy ) không thể viết chương trình 
cho máy cấp 1. Hơn nữa, ngay trên những máy người sử dụng có 
thể vi lập trình, sự phức tạp rất lớn của cấu trúc câ'p 1 cũng đủ làm 
hầu hết những người lập trình e ngại, trừ những người lập trình 
chuyên nghiệp. Ngoài ra, do không có một máy nào có sự bảo vệ 
phần cứng ở cấp 1, nên không thể cho phép một người sửa sai 
( debug ) các vi chương trình mới trong khi một người khác đang sử 
dụng máy. Đặc tính này hơn nữa còn cấm người sử dụng lập vi 
chương trình. 

5.1 CÁC THÍ DỤ VỂ CẤP MÁY QUI ƯỚC 

Thay vì cô' gắng định nghĩa một cách chính xác câp máy qui ước 
là gì ( có lẽ không thế định nghĩa được ), chúng ta sẽ giới thiệu cấp 
máy này bằng cách khảo sát các thí dụ, trước tiên là Intel và sau 
dó là Motorola. Mục đích của việc nghiên cứu 2 họ CPU hiện có này 
là nhằm trình bày những ý tưởng được thảo luận ở đây có thể được 
áp dụng như thế nào với thế giới thực. Các máy này sẽ được so 
sánh và đối chiếu theo nhiều cách khác nhau để trình bày những 
chọn lựa khác nhau của các nhà thiết kế khác nhau. 
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Không nên kết luận rằng phần còn lại của quyển sách này trình 
bày việc lập trình trên các họ CPU của Intel và Motorola. Các CPU 
này được dùng dể minh họa ý tưởng thiết kế một máy tính như là 
một chuỗi các câp máy. Những đặc tính khác nhau về cấu trúc của 
của chúng sẽ được khảo sát và thông tin về lập trình trẽn chúng 
cũng được giới thiệu tại những điểm cần thiết. Tuy nhiên, ở đây 
không cung cấp một mô tả hoàn toàn đầy đủ. Để hiểu thông suốt về 
tất cả chi tiết của các CPU, hãy tham khảo những tài liệu được các 
nhà chế tạo ra chúng xuât bản. 

Cuối cùng, chương này chủ yếu xử lý những chỉ thị và cấu trúc 
mà các chương trinh của người sử dụng dùng đến ( nghĩa là chương 
trình ứng đụng ). Các khía cạnh về cấu trúc và những chỉ thị liên 
quan đến người viết hệ điều hành sẽ bị bỏ qua hoặc được gác lại cho 
tới khi vấn đề được bàn đến trong chương 6. 

5.1.1 Họ 8088/80286/80386 của Intel 

Bắt đầu thảo luận về cấp máy qui ước với chip 8088 của Intel là 
thích hợp vì đây là bộ óc của các máy IBM PC và những máy mô 
phỏng theo, và do vậy CPU này được sử dụng rộng rãi hầu như trên 
khắp thế giới. 


Address 


0 

Byte 

1 

Byte 

2 

Byte 

3 

Byte 

4 

Byte 

5 

Byte 

6 

Byte 

7 

Byte 

8 

Byte 

9 

Byte 

10 

Byte 

i 

:_ T 



Wọrd at . 
address0 


Word at_ 
ađdress 2 


Word at 
address4 


16-Bit vvord 


Byte 1 


ByteO 


16-Bit word 


Byte 3 


Byte 2 


16-Đtt word 


Byte 5 


Byte 4 


Hình 5.1 Câu tr ức-hn nhơ của 8088. 
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Ađdress : địa chỉ 

Word at address 0 : từ ở địa chỉ 0 
16-bit word : từ 16-bit 

ở cấp máy qui ước, 8088 và 8086 giống hệt nhau nên mọi điều 
chúng ta nói về 8088 cũng áp dụng được cho 8086. Chip 8088 có thể 
địa chỉ hóa 2“° byte, đánh số liên tục bắt đầu từ 0 như trình bày 
trong hình 5.1. 

Các chỉ thị có thể hoạt động trên các byte 8-bit hoặc trên các từ 
16-bit. Từ không nhất thiết bắt đầu ở byte chẵn mặc dù với các từ 
bắt đầu ở byte chẵn, 8086 làm việc có hiệu quả hơn. 

Với bộ nhớ 2 20 byte, 8088 thực sự cần các địa chỉ 20-bit đề địa 
chỉ hóa bộ nhớ. Vì các thanh ghi và mọi thứ khác của máy đều 
dùng các từ 16-bit, nên các sô 20-bit rõ ràng không thuận tiện. Đế 
giải quyết vấn đề này, các nhà thiết kế CPU phải cần đên giải 
pháp gọi là kludge ( một biệt ngữ của máy tính chỉ một phương 
pháp không lịch sự và vụng về được dùng để làm một điều gì đó ). 
Giải pháp này đưa ra 4 thanh ghi segment : mã, dữ liệu, stack và 
phụ ( code, data, stack và extra ), mỗi thanh ghi segment chứa một 
địa chỉ bộ nhớ trỏ tới nền ( base ) của một segnicnt 64K. 

Mỗi thanh ghi segment trò tới một nơi nào đó trong- không gian 
địa chi 2 20 byte, như trình bày trong hình 5.2. Tất cả việc tìm nạp 
chỉ thị đều có liên quan đến thanh ghi segment mã. Thí dụ, nếu 
thanh ghi này trỏ tới dịa chỉ 96000 và bộ đêm chương trình có giá 
trị 1024, chỉ thị kê tiếp sẽ được tìm nạp từ địa chỉ 97204. Với giá 
trị này của thanh ghi segment mã, các chỉ thị đặt trong tầm địa chỉ 
từ 96000 tới 161535 đều được truy xuất. Để truy xuất một chỉ thị ớ 
ngoài tầm này, ta phải thay đổi nội dung thanh ghi segment mả. 

Tương tự, thanh ghi segment dừ liệu và thanh ghi segment stack 
dùng để truy xuất các segment dữ liệu và segrnent stack. Cuôi cùng, 
thanh ghi segment phụ ( cũng dùng để truy xuât segment dữ liệu ) là 
một thanh ghi dự phòng khi cần. 

Sơ đồ này có nghĩa là bất cứ lúc nào, 256K bộ nhớ đều có thế 
truy xuất được mà không phải thay đổi 1 thanh ghi segment nào cả. 
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Addresa 


0 

96000 


262144 


800000 




Hình 5.2 Sử dụng các thanh ghi segment trên 8088. 

cs ( Code segment register ) : thanh ghi segtnent mà 
DS ( Data segment register ) : thanh ghi segment dữ liệu 
ss ( Stack segment register ) : thanh ghi segtneni stack 
ES ( Extra segment register } : thanh ghi segment phụ 
Address : địa chỉ 

Một sô trinh biên dịch giới hạn chương trình với chiều dài 64K 
cho văn bản chương trình ( nghĩa là các chỉ thị ) và 64K khác cho 
cá dữ liệu và stack nhằm tránh tống phí ( overhead ) thời gian kết 
hợp với việc nạp và cất liên tục các thanh ghi segment hoặc dùng 
thanh ghi segment phụ. 

Theo lý thuyết, các thanh ghi segment nên có độ rộng 20 bit để 

trỏ tới bất kỳ địa chỉ nào trong không gian địa chỉ 2 20 byte. Tuy 

nhiên, như đã nói trên, 8088 không được trang bị để xử lý các số 
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thanh ghi segment chỉ trỏ tới những địa chỉ là bội số của 16 để 4 bit 
thấp nhất của địa chỉ là zero và 4-bit này không cần cất vào thanh 
ghi segment. Như vậy, các thanh ghi segment chỉ chứa 16 bit cao 
của địa chỉ 20-bit. 8088 có 14 thanh ghi 16-bit ( hình 5.3 ). 

Thanh ghi AX chủ yếu được dùng cho các phép toán sô' học. Thí 
dụ để tính tổng 2 sô' nguyên, chương trình có thể nạp 1 trong 2 số 
nguyên đó vào AX, sau đó cộng sô thứ 2 với AX và cuôi cùng cất AX 
vào bộ nhớ. Cũng có thề dùng những thanh ghi khác, nhưng các chỉ 
thị tương ứng để thực hiện phép toán sẽ dài hơn và chậm hơn so 
với những chỉ thị dùng thanh ghi AX. 


Name 



Descrtption 

Primary accumulator 
Arlthmetic, polnters 
Lopps 

Multỉplication and divisỉon 

Soưrce pointer for string operatlons 
Destlnatlon polnter lor strlng operatlons 
Base potnter 
stack pointer 

Code segment 
Data segment 
stack segment 
Extra segment 

Program counter 

Program status word 


Hình 5.3 Các thanh ghi của 8088 
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Name : tên 
Description : mô tá 

Primary accumuỉator : thanh chứa chính 
Arithmetic, pointers : sỏ học, các con trỏ 
Loops : các vòng lặp 

Multiplication and division : nhân và chia 

Source pointer for string operations : con trỏ nguồn cho các thao tác chuỗi 

Dest. pointer for string operations : con trỏ đích cho các thao tác chuỗi 

Base pointer : con trỏ nền 

Stack poìnter : con tró stack 

Code segment : segment mã 

Data segment : segment dữ liệu 

Stack segment : segmeìit stack 

Extra segment : segment phụ 

Program counter : bộ đếm chương trình 

Program status vvord ; từ trạng thái của chương trình PSW 

Thanh ghi BX tiêu biểu dùng đê chứa con trỏ ( pointer ) trỏ đến 
bộ nhớ, thanh ghi cx chứa sô đếm trong các chỉ thị lặp vòng. Để 
lặp lại một vòng lặp n lần, cx được nạp giá trị n sau mỗi lần lặp, 
cx được giảm 1 cho đến khi cx bằng zero, vòng lặp kết thúc. 

DX là một thanh ghi mở rộng của AX trong các chỉ thị nhân và 
chia, thanh ghi này chứa nửa cao của một tích 32-bit hoặc nửa cao 
của scí bị chia 32-bit. 

Mỗi thanh ghi 16-bit này ( AX, BX, cx, DX ) đều có nửa thấp và 
nửa cao, chúng đều có thể được địa chỉ hóa riêng lẻ. Khi dùng 
phương pháp địa chỉ hóa này, chủng hình thành một tập 8 thanh 
ghi 1-byte có thể dùng với những chỉ thị thao tác trên các đại lượng 
1-byte. Sử dụng các thanh ghi theo kiểu này là dâu vết còn tồn tại 
cùa cách làm việc trong 8080 cũ ( CPU 8-bit ). 

Thanh ghi SI và DI được dùng cho các thao tác chuỗi. Một thao 
tác chuỗi điển hình cần có địa chỉ nguồn xác định bới thanh ghi SI 
trong segment dữ liệu và địa chỉ đích xác định bởi thanh ghi DI 
trong segment phụ. Thí dụ, chỉ thị cho phép di chuyển một số byte 
từ nguồn tới đích. 
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Thanh ghi BP và SP thường được dùng để địa chỉ hóa stack. BP 
trỏ tới đáy của khung stack hiện tại và SP trỏ tới đỉnh của khung 
stack. Biến cục bộ của thủ tục hiện tại thường được địa chỉ hóa 
bằng cách cung cấp offset của biến kề từ BP ( bơi vì biến cục bộ 
không thề chỉ rõ địa chỉ liên quan tới SP ). 

Kế tiếp là 4 thanh ghi segmcnt, như đã mô tả trước đây, theo 
sau là bộ đếm chương trình PC dùng đế trỏ tới chỉ thị kế tiếp ( liên 
quan tới vị trí bắt đầu cua segment mã ). 

Hai thanh ghi cuối cùng là con trỏ chương trình IP ( instruction 
pointer ) và các cờ ( flag ), trên hầu hết các máy khác chúng được 
gọi là bộ đếm chương trình và từ trạng thái chương trình PSW 
( program status word ). Bộ đếm chương trình trỏ tới chỉ thị kế tiêp 
sẽ dược thực hiện. 

Thanh ghi các cờ ( xem hình 5.4 ) là thanh ghi mới. Thật ra đây 
không phải là thanh ghi bình thường mà là một tập hợp các bit có 
thề được thiết lập ( set ), xóa ( clear ) và kiểm tra bới những chỉ thị 
khác nhau. Một cách tóm tắt, các bit có ý nghĩa như sau. Bit D xác 
định hướng ( direction ) của các thao tác chuỗi. Bit I cho phép ngắt. 
Bit T cho phép chạy chương trình từng bước để theo dõi. 



Bíts 12-15 11 10 98765432 10 


Hình 5.4 Thanh ghi các cờ cũa 8088 


Overflow : tràn 
Interrupt : ngắt 
Sign : dấu 

Auxiliary carry : nhớ phụ 
Carry ; nhớ 


Direction : hướng 
Trap : bẫy 
Zero : zero 
Parity : chắn lé 
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Các bit còn lại thường được gọi là các mã điều kiện ( condition 
code ) bới vì chúng được thiết lập và xóa bởi những chỉ thị khác 
nhau tùy thuộc vào những điều kiện khác nhau xảy ra ( kết quả âm, 
zero, và v.v... ). Bit o được thiết lập khi kết quả của phép toán sô" 
học bị tràn. Bit s được thiết lập bởi các chỉ thị sô' học, 1 cho kết 
quả âm, 0 cho kết quả dương. Tương tự. bit z được thiêp lập là 1 khi 
kết quả bàng zero và bị xóa về 0 khi kết quả khác zero. Các bít A 
và c biểu thị sô' nhớ xuâ't hiện ơ giữa và ở cuối toán hạng. Cúối 
cùng, bit p là bít kiểm tra chẩn lé ( paritv ) kết quá cua một chỉ thị 
số học. Có 7 bit không được sử dụng trong 8088, nhưng một số 
trong chúng được dùng cho nhũng chip ke thừa. 

Tập lệnh của 8088 được liệt kê trong hình 5.5. Nhiều chỉ thị 
tham chiếu 1 hoặc 2 toán hạng ( operand ), hoặc trong các thanh 
ghi hoặc trong bộ nhớ. Thí dụ, chỉ thị INC cộng thêm 1 vào toán 
hạng. Chỉ thị ADD cộng nguồn với đích. Một sô chỉ thị có vài biến 
thê liên quan mật thiết. Thí dụ, các chỉ thị dịch bit có thể dịch trái 
hoặc dịch phải, có thể xử lý với bit có dâu hoặc không. Hầu hết các 
chi thị đều có nhiều dạng mã hóa khác nhau tùy thuộc vào bản chất 
của các toán hạng. 

Trong hình 5.5, trường scr là nguồn của thông tin và không bị 
thay đổi. Trái lại, trường dst là đích của thông tin và thường bị 
thay đối bởi chì thị. Có những quy luật cho phép một toán hạng nào 
đó là nguồn hay là đích, chúng thường thay đổi giừa chỉ thị này với 
chỉ thị khác và chúng ta sẽ không bàn thêm ở đây. Đa số chĩ thị 
đều có 2 biến thể, một biến thể hoạt động trên các từ 16-bit và một 
biến thể hoạt động trên các byte 8-bit. Những biến thể này được 
phân biệt bằng một bit trong chỉ thị. 

Để thuận tiện, ta sẽ chia các chỉ thị thành nhiều nhóm. Nhóm 
đầu tiên chứa các chi thị di chuyền dữ liệu bên trong máy ; giừa các 
thanh ghi, bộ nhớ và stack. Nhóm thứ 2 thực hiện các phép tính số 
học, cả số có dấu và không có dấu. Đối với phép nhân chia, tích số 
hoặc số bị chia 32-bit dược cất trong AX ( chứa phần thấp ) và DX 
c chứa phần cao ). 
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MOV dst, src 

Move src to dst 

PUSH src 

Push src onto the stack 

POD dst 

Pop from the stack to dst 

XCHG datl, dst2 

Exchange dstl and dst2 

LEA dst, src 

Load ettective address of src into dst 

LDS dst, src 

Load data segment register and dst using src 

LES dst, src 

Load extra segment register and dst uslng src 


ADD dst, src 

Add src to dst 

SUB dst, src 

Subtract src from dst 

MUL src 

Multlply src by AX (unsigned) 

IMUL src 

Multlply AX by src (signed) 

DIV src 

Divíde DX:AX by src (unsigned) 

IDIV src 

Divide DX:AX by src (signed) 

AOC dst, src 

Add src to dst, then add carry bit 

SBB dst, src 

Subtract src from dst, then subtract carry bit 

INC dst 

Add 1 to dst 

DEC dst 

Subtract 1 from dst 

NEG dst 

Negate dst (subtract it from 0) 


DAA 

Decimal adịust 

DAS 

Decimal adjust for subtraction 

AAA 

ASCII adịust for addtion 

AAS 

ASCII adjust for subtration 

AAM 

ASCII adịust for multiplication 

AAD 

ASCII adjust for di Vision 


AND dst, src 

Booleạn AND 01 src into dst 

OR src, dst 

Boolean OR of src into dst 

XOR src, dst 

Boolean exclusìve OR of src into dst 

NOT dst 

Replace dst wỉth its t*s complement 


SAL/SAR dst, count 

Shlft dst lett/right count bits 

SHL/SHR dst, count 

Loglcal shitt lett/rlght by count 

ROL/ROR dst, count 

Rotate dst left/right count bits 

RCL/RCR dst, count 

Rotate dst through carry bits 


TST srct, src2 

Boolean AND the operands and set FLAGS 

CMP srcl, src2 

Compare src 1 to $rc2 and set PLAGS 


Hình 5.5 Tập chỉ thị của 8088 
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o 


ư> 

ặv 

£ 

ặa 

01 


■g 

5 

o 


■g 

c 

5 

o 


o 

5 

c 

Ẹ 


o 
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JMP addr 

Jump to addr 

Jxx addr 

Conditional jumps based on FLAGS reglster 

JCXZ addr 

Jump if cx is o 

CALL addr 

Call procedure at addr 

RET 

Return from procedure 

1RET 

Return from interrupt 

LOOPxx 

Loop until condltion met 

INT addr 

Inttiate a software interrupt 

INTO 

Interrupt if overflow bit Is set 


LODS 

Load strỉng 

STOS 

store string 

MOVS 

Mo ve string 

CMPS 

Compare two strings 

SCAS 

Scan string 


STC 

Set carry blt ỉn FLAGS register 

CLC 

Clear carry bit in FLAGS register 

CMC 

Complement carry blt ỉn FLAGS register 

STD 

Set dlrection bit In FLAGS reglster 

CLD 

Clear dlrection bỉt in FLAGS register 

STI 

Set ỉnterrupt bit in FLAGS register 

CLI 

Clear interrupt bít in FLAGS register 

PUSHF 

Push the FLAGS register onto the stack 

POPF 

Pop the FLAGS register from the stack 

LAHF 

Load AH trom FLAGS registers 

SAHF 

Store AH in FLAGS registers 


CWD 

Convert word In AX to double word In DX:AX 

CBW 

Convert byte in AL to word ỉn AX 

XLAT 

Translate AL accordlng to a table 

NOP 

No operatlon 

HLT 

Halt 

ESC 

Escape to (start) tloating polnt coprocessor 

IN port 

Input a byte or word from port 

OUT port 

Output a byte or word to port 

WAIT 

Wait for an interrupt 


Hình 5.5 ( tiếp theo ) 
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Nhóm thứ 3 thực hiện các phép tính sỏ BCD ( binary-coded 
decimal ), xử lý từng byte như là 2 nibble ( nứa byte ) 4-bit. Mỗi 
nibble chứa một sô" thập phân ( từ 0 đến 9 ). Các tổ hợp bit từ 1010 
tới 1111 không được dùng. Một sô nguyên 16-bit có thể chứa một số 
thập phân từ 0 đến 9999. Dù dạng lưu trữ này không có hiệu quả 
nhưng tránh được sự cần thiết phải đổi sô thập phân sang nhị phân 
rồi sau đó phải đổi lại thành thập phân để xuất kết quả. Những chỉ 
thị này được dùng đề thực hiện các phép tính số học trên các sô" 
BCD. 

Các chỉ thị đại số logic và dịch / quay thao tác với các bit trong 
1 từ hoặc 1 byte theo nhiều cách khác nhau. Một vài kết hợp cũng 
được cung cấp. 

Hai nhóm chỉ thị kế tiếp thực hiện phép kiểm tra và so sánh, 
sau đó thực hiện nhảy dựa vào kết quá sinh ra. Kết quá của các chỉ 
thị kiểm tra và so sánh được cất trong những bit khác nhau của 
thanh ghi cờ. Jxx nghĩa là tập các chỉ thị nhảy có diều kiện tùy 
thuộc vào kết quả của phép so sánh trước ( nghĩa là, các bit trong 
thanh ghi cờ ). 

8088 có vài chỉ thị nạp, câ't, di chuyển, so sánh và quét chuỗi 
các ký tự hoặc các từ. Những chỉ thị này có thể được mớ đầu bằng 1 
byte đặc biệt gọi là REP, byte này làm cho chỉ thị được lặp lại cho 
tới khi thỏa mãn một điều kiện nào đó, như cx chẳng hạn, trong 
đó cx bị giảm 1 sau mỗi lần lặp cho tới khi bằng 0. Bằng cách này, 
các khối dữ liệu tùy ý có thể dược di chuyển, so sánh, và V.V.... 

Nhóm cuối cùng là những chỉ thị hỗn độn không thích hợp 
trong một nhóm nào cả. Nhừng chỉ thị này bao gồm các chỉ thị biến 
đổi, xuất / nhập và dừng CPU. 

8088 ( và cả 80286, 80386 ) có một số chỉ thị tiền tố ( preíĩx ), 
và chúng ta đã đề cập đến một tiền tố, REP. Mỗi tiền tô này là 
.một byte đặc biệt thường đứng trước chỉ thị. REP làm cho chỉ thị 
theo sau tiền tô' này được lặp lại. LOCK dành riêng bus cho toàn bộ 
chỉ thị để cho phép dồng bộ đa xử lý. Những tiền tô' khác được dùng 
để buộc chỉ thị phải tìm nạp toán hạng của chỉ thị từ stack hoặc từ 
segment phụ thay vì từ segment dữ liệu. 
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80286 của Intel 

Chúng ta đã nghiên cứu xong 8088, bây giờ hãy chuyển sang 
80286. Ở cấp máy quy ước, bộ xử lý 80286 rât giống với 8088. 
Những khác nhau chính có liên quan đên chương trình của người sử 
dụng được tóm tắt trong hình 5.6. Để dễ dàng chạy các chương 
trình 8088 trên 80286, Intel trang bị cho chip 2 chế độ. Trong chế 
độ địa chi thực ( real address mode ), thường chỉ gọi là chê độ 
thực, 80286 ngụy tạo thành 8088 và thực hiện hầu hết mọi thao tác 
của 8088. ơ chế độ địa chỉ ảo được bảo vệ ( protected Virtual 
address mode ), thường được gọi là chê độ bảo vệ, 80286 có thêm 
một sô" đặc tính không có trong 8088. 


8088 

80286 

Chế độ thực 

Chế độ bảo vệ 

Không gian địa chí 1 MB 

16384 segment 64K 

Thanh ghi segment chứa con trỏ 

Thanh ghi segment chứa bộ chọn 

Không có cơ chế bảo vệ 

Bảo vệ bằng các vòng 

Không hỗ trợ đa chương trình 

Hồ trợ đa chương trình 

Các chỉ thị cơ bản 

Các chỉ thị cơ bản, mở rộng, diều khiển 


Hình 5.6 Những khác nhau chính giữa 8088'và 80286 đối với chương trình 

của người sử dụng. 


Ở cả 2 chế độ, 80286 đều có 14 thanh ghi giông như trình bày 
trong hình 5.3. Các thanh ghi có cùng chiều dài và thực hiện cùng 
các chức năng như trên 8088. Ngoài ra, tất cả chỉ thị liệt kê trong 
hình 5.5 làm việc được trên 80286 ở cả 2 chế độ và một số trường 
hợp có cùng ngữ nghĩa giống hệt nhau. Sự khác nhau chỉ là những 
đặc tính định nghĩa việc hiện thực ( implementation-deíìned 
íeature ), như vậy diều gì sẽ xảy ra nếu cất thanh ghi SP vào stack. 
Trước tiên 8088 giảm SP đi 1 và sau đó cất • giá trị mới, trong khi 
80286 trước tiên lưu giữ SP rồi cất giá trị được lưu giữ vào stack. 
Nguyên nhân của sự khác nhau là đo có sự thay đổi trong vi mã 
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( micro-code ). Tóm lại, gần như tất cả các chương trình xử lý tốt ở 
8088 sẽ hoạt động không có sự thay đổi nào trên 80286 ở cả 2 chẽ 
độ. 

Tuy nhiên, 2 chế độ này lại không giông nhau. Sự thay đổi lớn 
nhât ở cấp máy này là cách định địa chỉ bộ nhớ ( memory 
addressing ). Trong chế độ thực, 80286 có không gian địa chỉ tuyến 
tính 1 MB, giông như 8088. Trong chế độ bảo vệ, 80286 có 16384 
segment , mỗi segment dài đến 64K. Trong lúc thiết kê 80286, một 
vấn đề phát sinh là làm thế nào cho phép các chương trình sử dụng 
bộ nhớ thêm vào mà không có sự thay đổi triệt để về máy ( CPU ). 

Một phương pháp có thể được gắn liền với thiết kế trong hình 
5.2 nhưng cần gia tăng kích thước của các thanh ghi segment để 
thích ứng với không gian địa chỉ lớn hơn. Phương pháp này không 
có hiệu lực vì yêu cầu một kích thước không thuận tiện cho các 
thanh ghi segment. 

Thay vào đó một phương pháp phức tạp hơn được sử dụng. Các 
thanh ghi segment vẫn duy trì kích thước 16 bit, nhưng thay vì biểu 
thị các con trỏ 20-bit, ộ chế độ bảo vệ chúng biểu thị các . chỉ số 
( được gọi là bộ chọn [ selector ] ) trong các bảng hệ thông. Vậy thì 
nạp giá trị 2 vào DS không có nghĩa là segment dữ liệu bắt đầu ở 
địa chỉ 2, mà đúng ra là segment dữ liệu được trỏ tới bởi điểm nhập 
thứ 2 trong 1 bảng nào đó. Mỗi điểm nhập chứa 1 con trỏ 24-bit và 
thông tin khác. Chúng ta sẽ nghiên cứu cách định địa chỉ của 80286 
và 80386 chi tiết hơn khi đến phần bộ nhớ ảo trong chương 6. 

80286 ở chế độ bảo vệ có nhiều điểm khác với 8088. Dùng từ 
"bảo vệ" trong tên của chế độ gợi cho thấy rằng chế độ cung cấp 
một sự bảo vệ nào đó. Có thể khởi dộng các bảng segment theo cách 
như vậy khi 80286 được sử dụng cho các hệ thông lập trình đa 
chương, mỗi quá trình có thể được ngăn ngừa để không truy xuất 
các segment đang thuộc một quá trình khác. Vì cơ chế này có liên 
quan mật thiết tới bộ nhớ ảo, nên chúng ta sẽ trì hoản việc thảo 
luận cho đến chương 6. 

Ngoài tập lệnh của 8088, 80286 cùng có thêm vài chỉ thị nữa. 
Chúng được liệt kê trong hình 5.7. 
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Chỉ thị 

Mỏ tả 

PUSHA 

Cất tất cả các thanh ghi vào stack 

POPA 

Lấy tất cả các thanh ghi ra khỏi stack 

ENTER count,depth 

Thiết lập stack cho điểm nhập của thủ tục 

LEAVE 

Xóa stack khi thoát khỏi thủ tục 

BOUND reg.addr 

Kiểm tra các phạm vi của dãy 

VERR/VERW 

Kiểm tra có phải một segment có thể đọc/có thể ghi 


Hình 5.7 Các chỉ thị thêm vào hiện diện trong 80286 


Hầu hết các chỉ thị này giúp cho 80286 có thể thực hiện các 
thao tác chính với ít chỉ thị hơn so với 8088. Hơn nữa, một sô" trong 
nhiều quy luật khắt khe về những toán hạng nào được phép dùng 
với những chỉ thị nào đã được nới lỏng. Thí dụ chỉ thị PƯSH bây 
giờ có thể có toán hạng là một hằng số. Trên 8088, chỉ thị PƯSH 
chỉ có thể có các toán hạng thanh ghi và toán hạng bộ nhớ, không 
được là toán hạng hằng số. Sự thay đổi này làm cho việc gọi thủ tục 
hiệu quả hơn do việc truyền các hằng số như là các tham số. Chỉ thị 
PUSHA cất AX, cx, DX, BX, SP, BP, SI và DI vào stack theo trật 
tự này. Chỉ thị POPA khôi phục các thanh ghi đã cất. Những chỉ 
thị này được các thường trình phục vụ ngắt ( interrupt routine ) sử 
dụng để cất trạng thái của máy trước khi xử lý một ngắt. 

Các chỉ thị ENTER và LEAVE thực hiện những động tác được 
cần đến khi vào hoặc ra khỏi một thủ tục. Bằng cách tạo ra những 
chỉ thị đặc biệt để thực hiện tât cả các động tác một lần, việc vào 
và ra khỏi thủ tục được thực hiện nhanh hơn. 

Chỉ thị BOƯND thực hiện việc kiểm tra các biên dãy ( array 
bound ). Giống như tất cả các chỉ thị mới khác, chỉ thị BOUND 
cũng cung cấp sự tối ưu hóa, vì với cùng một công việc như vậy 8088 
phải thực thi một chuỗi chỉ thị, nên chậm hqn nhiều. 
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Cuôi cùng các chỉ thị VERR và VIEW có liên quan đến sự phân 
đoạn của 80286. Chúng cho phép một chương trình có thể tránh 
được lỗi do sự phân đoạn. 

80386 của Intel 

80286 có 2 hạn chế cơ bản dần đến việc Intel phát triển 80386. 
Trước tiên, 80286 là một CPU 16-bit với các thanh ghi, các toán 
hạng và các chỉ thị 16-bit. Trong nhiều ứng dụng, người ta cần một 
CPƯ#32-bit. Thứ hai, mô hình bộ nhớ gồm nhiều segment 64K là 
một rắc rối chính. Vấn đề không phải ở sô segment ( 16384 ) mà là 
kích thước nhỏ của segment ( 64K ). 80386 loại bỏ được các vân đề 
này và đồng thời có thêm một số' đặc tính mới làm cho 80386 có 
khả năng nhiều hơn 80286. Ngoài ra, 80386 cũng nhanh hơn nhiều. 

Khi thiết kê 80386, Intel đã nổ lực rất lớn để duy trì tính tương 
thích với 8088 và 80286. Sự khác nhau chính thây được giữa 80286 
và 80386 đối với các chương trình của người sử dụng được trình bày 
trong hình 5.8. 80386 có cả 2 chế độ thực và bảo vệ và chúng hoạt 
động tốt hơn nhiều so với 80286. Chế độ mới trên 80386 là chế dộ 
ảo, dạng trung gian giữa các chế độ thực và chế độ bảo vệ. 


80286 

80386 

Các chế độ thực và bảo vệ 

Các chế độ thực, ảo và bảo vệ 

16384 segment í đến ) 64K 

16384 segment ( đến ) 4G 

4 thanh ghi segment 

6 thanh ghi segment 

Phép toán 8- và 16-bit 

Phép toán 8-, 16- và 32-bit 

Các thanh ghi 16-bit 

Các thanh ghi 32-bit 

Các kiểu địa chỉ 16-bít 

Các kiểu địa chỉ 16- và 32-bit 

8 tiền tố 

12 tiền tố 

( không hiện diện ) 

Một sô' chỉ thị mới ' 


Hình 5.8 Các khác nhau chính giữa 80286 và 80386 đối với người sử dụng 
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Giống như chế độ thực, chế độ ảo được dự định cho việc chạy các 
chương trình nhị phân cũ của 8088. 

Sự khác nhau là ở chế độ thực, chương trình có thể thực hiện 
bất cứ điều gì mà 8088 có thể thực hiện, bao gồm việc thay đổi các 
thanh ghi segment , thực hiện I/O và v.v... Điều này làm cho chương 
trình có nhiều khả năng phá vờ hệ thông hơn. ơ chê độ ảo, tất cả 
các chỉ thị thông thường đều làm việc như trên 8088, nhưng các chỉ 
thị có khả năng làm cho hệ thông ngừng hoạt động, như là I/O, thì 
không thực hiện được. Thay vào đó nhừng chỉ thị này gây ra 
chuyển điều khiển tới hệ điều hành, sau đó hệ điều hành có thể mô 
phỏng chúng. Kết quả là có nhiều chương trình của 8088 hoạt động 
đồng thời, mỗi một chương trình được bảo vệ khỏi các chương trình 
khác và hệ điều hành được bảo vệ khỏi tất cả các chương trình đó. 

Nhiều máy tính dựa trên 80386 chạy hệ diều hành UNIX như là 
một hệ điều hành tự nhiên và cung cấp cho người sử dụng nhiều 
cửa sổ. Người sử dụng có thể chạy các chương trình của MS-DOS cũ 
trong 1 hoặc nhiều cửa sổ. Kỹ thuật đặc biệt này được thực hiện do 
hệ điều hành UNIX chuyển 80386 sang chế độ ảo ngay trước khi 
khởi động một chương trình của MS-DOS. Tất cả những cô' gắng của 
chương trình để thực hiện I/O, ghi lên RAM video và V.V.. gây ra 
chuyên điều khiển tới hệ điều hành UNIX, sau đó hệ điều hành 
thực hiện công việc mong muôn và: trả điều khiển về cho chương 
trình của MS-DOS. Bằng cách này, nhiều chương trình của MS-DOS 
cũ có thể chạy đồng thời trong môi trường UNIX và truy xuất các 
tập tin của UNIX. 

Một trong những mục tiêu chính của 80386 là loại bỏ giới hạn 
64K cùa segmcnt mà vẫn duy trì được tính tương thích với các 
chương trình của 80286, trong đó mỗi segment có kích thước là 64K. 
Điều dường như không thể thực hiện được này đã được hoàn thành 
một cách khéo léo. Cả 80286 và 80386 đều sử dụng các bộ chọn 
( selector ) trong các thanh ghi segment. về cơ bản mỗi bộ chọn chỉ 
là một chỉ số thuộc về một trong 2 bảng đặc tả segment ( segment 
descriptor ) 8K. Mỗi bảng đặc tả’ chứa địa chỉ, kích thước, mã bảo 
vệ { protection code ) và thông tin khác của segment. 
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Trên 80386, 1-bit chưa sử dụng trong mỗi bảng đặc tả được dùng 
dể cho biết segment là 16-bit hay 32-bit. Trong các segment 16-bit, 
địa chỉ tối đa là 64K và tất cả thao tác trên từ thực hiện với các từ 
16-bit. Trong segment 32-bit, địa chỉ tôi đa là 4G ( 2 32 byte, khoảng 
4 tỉ byte ) và tất cả thao tác trên từ đều thực hiện với các từ 32-bit. 
Cũng có thể trên cơ sở của từng chỉ thị một ( instruction-by- 
instruction ) để gạt bỏ những mặc định này bằng cách chèn thêm 
một tiền tố ( preíix ) trước chỉ thị, cho phép chương trình sử dụng 
sự pha trộn giữa các segment 16-bit và 32-bit. 

Kết quả của câu trúc này là chương trình của 80386 có thể địa 
chỉ hóa tối đa 16384 segment với mỗi segment có kích thước tối đa 
4G cho toàn bộ không gian địa chỉ 2 4ti byte. Không gian địa chỉ này 
lớn hơn hoặc bằng với không gian địa chỉ của hầu hết các 
mainírame và các siêu máy tính ( supercomputer ). Thời kỳ có thế 
nói máy vi tính xuất phát từ siêu máy tính bằng cách xem máy nào 
có không gian địa chỉ lớn hơn đã thuộc về quá khứ. 

Hậu quả rõ ràng của việc có một không gian địa chỉ 2 1b byte là 
các con trỏ phải có chiều dài ít nhất là 46 bit, một con sô lớn và bất 
tiện. Đối với hầu hết các ứng dụng đây là một kích thước quá lớn. 
Thay vào đó, nhiều chương trình của 80386 chỉ sử dụng một 
segment 2 32 byte. Mô hình này thường được gọi là " kiếu Motorola " 
bởi vì không gian địa chỉ của 680x0 bao gồm 1 segment 2 32 byte. 

Khi dùng nhiều segment, một chương trình của 80386 vẫn bị 
hạn-chế với 1 segment cho mã, 1 segment cho dữ liệu và 1 segment 
cho stack ở bất kỳ thời điểm nào, giống như 8088. Cũng như 8088, 
thanh ghi segment phụ được cung câp để làm cho chương trình có 
thể truy xuất tạm thời một segment khác. 80386 có thêm 2 thanh 
ghi segment nữa, FS và GS, dùng để làm giảm sô lần nạp cho các 
thanh ghi segment. Bằng cách này có thê truy xuât 6 segment mà 
không phải thay đổi bất kỳ thanh ghi segment nào. 

Ngoài việc cung cấp nhiều không gian địa chỉ, tiên bộ quan 
trọng khác của 80386 là khả năng thực hiện các phép tính 8“bit, 
16-bit và 32-bit. Các thanh ghi được mở rộng thành 32 bit như 
trình bày trong hình 5.9. Các thanh ghi được mở rộng có cùng tên 
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với các thanh ghi 16-bit cũ, nhưng có thêm chữ E " ở phía trước. 
Trong segment 32-bit, chỉ thị di chuyển 1 từ tới AX/EAX bây giờ sẽ 
chuyên tới EAX, trừ phi được xác định bởi một tiền tô" đặc biệt.. 

Mặc dù không cần thiết, Intel cũng quyết định thay đổi phương 
pháp địa chỉ hóa bộ nhớ cho các chỉ thị trên 80386. Trong các 
segment 16-bit, mọi công việc được thực hiện giống như trên 8088 
và 80286. Tuy nhiên, trong các segment 32-bit xuất hiện thêm các 
kiểu định địa chỉ ( addressing mode ) mới. Những kiểu định địa chỉ 
này bao gồm những phương pháp có hiệu quả để truy xuâ't các phần 
tứ dãy { array eìement ) và các đặc tính khác. Chúng ta sẽ xem xét 
chú đề về các kiểu định địa chỉ ở cuối chương này. Trong lúc này 
nên biết rằng, các chỉ thị cần có các trường cho kiểu định địa chỉ để 
chỉ rõ các toán hạng của chỉ thị ở đâu : các thanh ghi, bộ nhớ, stack 
hoặc một nơi nào khác. 

Việc đưa vào các thanh ghi segment FS và GS đòi hỏi phải dưa 
vào 2 tiền tô ( preíĩx ) mới nhằm xác định rằng chỉ thị kế tiếp sử 
dụng chúng thay vì sử dụng thanh ghi mặc định ( thường là DS ). 
Hơn nừa, 2 tiền tô' cũng dược đưa vào để cho phép một chỉ thị trong 
segment 16-bit sử dụng được một địa chỉ hoặc một toán hạng 32-bit 
và ngược lại. Danh sách đầy đủ các tiền tô' được cho trong hình 
5.10. 

ớ 80386 còn có mặt một nhóm chỉ thị mới dùng để kiểm tra-bit, 
chuyển đổi dữ liệu { data conversion ), di chuyển và những công việc 
khác. Các chỉ thị mới được liệt kê trong hình 5.11. 

Nhìn chung những chỉ thị này kỳ lạ hơn những chỉ thị thêm vào 
trong 80286. Các chỉ thị BSF và BSR xem xét các toán hạng của 
chúng, tìm kiếm các bit 0 và thiết lập các cờ sao cho phù hợp. BTx 
là một nhóm 4 chỉ thị có thể kiểm tra, thiết lập, xóa và lây bù 
( complement ) các bit riêng lẻ trong 1 từ mà không làm xáo trộn 
các bit khác. 

Các chỉ thị CWDE và CDQ đổi 1 từ thành 1 từ kép ( double 
word ) và đổi 1 từ kép thành 1 từ 8-byte ( quad word ) bằng cách 
thực hiện việc mở rộng dấu ( sign extension ). 2 chỉ thị MOVxx di 
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chuyển các khoản dữ liệu nhỏ đến các khoản dử liệu dài hơn, sứ 
dụng hoặc không sử dụng việc mở rộng dấu. 


Tiền tố 

88 

286 

386 

Mô tâ 

REP 

X 

X 

X 

Lập lại cho tới khi cx = 0 

REPZ 

X 

X 

X 

Lập lại cho tới khi cờ z dược 
thiết lập 

EEPNZ 

X 

X 

X 

Lập lại cho tới khi cờ z được 
xóa 

LOCK 

X 

X 

X 

Khóa bus ngoài 

cs 

X 

X 

X 

Sứ cỉụng segment mã 

ss 

X 

X 

X 

Sử dụng segment stack 

DS 

X 

X 

X 

Sử dụng segment dữ liệu 

ES 

X 

X 

X 

Sứ dụng segment phụ 

FS 



X 

Sử dụng segmenỉ F 

GS 



X 

Sứ dụng segment G 

Kích thước toán hạng 



X 

Chuyến đổi kích thước toán 
hạng ( 16 bit hay 32 bit ) 

Kích thước địa chỉ 



X ! 

Chuyển đổi kích thước địa chỉ 
{ 16 bit hay 32 bit ) 


Hình 5.10 Các tiền tô của 8088, 80286 và 80386 

Chỉ thị SETcc thực tế là một nhóm 30 chỉ thị, chúng lưu 1 byte 
vào đích. Byte này chứa 0 hoặc 1 tùy thuộc vào trạng thái của các 
bit mã điều kiện khác nhau. Đôi khi chỉ thị này còn được các 
chuyên gia viết trình biên dịch sử dụng để đánh giá các biểu thức 
đại sô' logic. 

Cuối cùng, các chỉ thị SHxD là các thao tác dịch bit các toán 
hạng 32-bit, và Lxx được dùng để nạp các thanh ghi segment. 
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Chỉ thị 

Mô tá 

BSF/BSR 

Quét bít thuận/nghịch 

BTx 

Các thao tác kiểm tra bit 

CDQ/CWDE ị 

Đối chiều dài của tóan hạng 

MOVSX 

Di chuyển có mở rộng dấu 

MOVZX 

Di chuyển không mở rộng đâ\i 

SETcc 

Thiết lập byte từ các mả điều kiện 

SHLD/SHRD 

Dịch trái/phải toán hạng 32-bit 

Lxx 

Nạp bộ chọn vào FS, GS và ss 


Hình 5.11 Các chỉ thị thêm vào 80386. 


5.1.2 Họ 68000/68020/68030 của Motorola 

Như đã đề cập trước đây, các chip 68000, 68020 và 68030 của 
Motorola có nhiều điểm giống nhau hơn so với các chip 8088, 80286 
và 80386 của Intel. Điều đó cũng được duy trì ở cấp máy quy ước. 
Thí dụ cấu trúc bộ nhớ của cả 3 bộ xử lý này giống hệt nhau. Hình 
5.12 trình bày cấu trúc bộ nhớ của 3 bộ xử lý này. Motorola gọi một 
lượng 16-bit là một từ và một lượng 32-bit là một từ dài ( long 
word ) thay vì gọi chúng là từ và từ kép ( double-word ) như Intel. 

So sánh hình 5.12 với hình 5.1, ta thấy cả 2 đều có các từ 16-bìt 
và các từ dài hoặc từ kép 32-bit ( trên 80386 ) nhưng trật tự byte 
thì khác. Các CPU của Intel dùng trật tự byte kiểu little endiũỉi, 
nghĩa là các byte được đánh số bắt dầu từ byte thấp ( low-order ). 
CPU của Motorola dùng trật tự byte kiểu big endian. 2 phương pháp 
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này có giá trị tương đương nhưng việc kêt nôi chúng trong mạng là 
nguồn gốc của nhiều rắc rối. 


Address 



Hình 5.12 Câu trúc định địa chỉ cho bộ nhớ chính của 680x0 

Addresses : các địa chỉ 

Word at address 0, 2, 4 : từ ở địa chỉ 0, 2, 4 

16-bit word : từ 16-bit 

32-bit word : từ dài 32-bit 

Tất cả bộ xử lý 680x0 đều có địa chỉ 32-bit, vì thế không gian 
địa chỉ theo lý thuyết của chúng lên đếh là 2 32 byte. Tuy nhiên, trên 
68000 có ánh xạ một-một giữa bộ nhớ vật lý và địa chỉ chương 
trình, do vậy giới hạn về logic cũng giông như giới hạn về vật lý, 
không gian địa chỉ của 68000 là 16M. 68020 và 68030 không có sự 
hạn chế này, các chương trình viết trên chúng thực sự có thề tham 
chiếu toàn bộ không gian địa chỉ 32-bit. 

Tất cả các bộ xử lý 680x0 đều có 17 thanh ghi 32-bit dùng cho 
các chương trình của người sử dụng và 1 thanh ghi 16-bit để chứa 
các bit trạng thái ( giông thanh ghi cờ của Intel ). 8 trong sô' các 
thanh ghi 32-bit, A0 tới A7, là các thanh ghi địa chỉ và thường chứa 
các địa chĩ của các biến và các cấu trúc dữ liệu đặt trong bộ nhớ 
chính. Các thanh ghi A0 tới A6 không có chức năng chuyên dụng, 
còn A7 là con trỏ stack. 
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rn 


8 thanh ghi dừ liệu 32-bit, DO tới D7, là .các thanh ghi dữ liệu 
đa năng ( general-purpose ). Hầu hêt các tính toán đều được tiên 
hành trên chúng và các toán hạng có thé dài 8-bit, 16-bit và 32-bit. 
Các phẩn 8 và 16-bit thấp của các thanh ghi D không có tên riêng, 
giồng như của Intel. Thanh ghi 32-bit thứ 17 là bộ đêm chương 
trình. Các thanh ghi được trình bày trong hình 5.13. 





DO 

DI 

D2 

D3 

D4 

D5 

D6 

D7 


Program counter 


Status reglster 


Hình 5.13 Các thanh ghi của 680x0 

User stack pointer : con trỏ stack cùa người sử dụng 
Program counter : bộ đếm chương trình 
Status register : thanh ghi trạng thái 

Giông như các CPU cua Intel, các CPU 680x0 cùng có 1 thanh 
ghi chứa các bít trạng thái và các bít cờ. Thanh ghi 16-bit này được 
trình bày trong hình 5.14. Byte thấp chứa 5 bit được thiết lập bởi 
hầu hết các lệnh, tùy thuộc vào kết quả thao tác vừa thực hiện. Bit 
c ghi lại sô' nhớ của bit cuối cùng bên trái. Bit o phát hiện tràn. 
Bit z được thiết lập khi kết quả bằng zero. Bit N được thiết lập khi 
kết quả âm. Bit X là một biến thể phụ của bit nhớ. 
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Byte cao của thanh ghi trạng thái được hệ điều hành sử dụng để 
điều khiển máy ( CPU ). Byte này chứa các trường xử iý trạng thái 
CPU, ngắt ( interrupt ) và theo dõi ( tracing ) của CPU. Chương 
trình của người sử dụng không dùng được byte này. 



TE 

s 

43 

IPM ; 

1 v> ■: ' 7 ,1 

K 

N 

z 

0 

c 

15 14 13 12 11 

10 9 9 7 6 5 

4 

3 

2 

1 

0 


Hình 5.14 Thanh ghi trạng thái của 680x0 
Trace enable : cho phép theo dõi 

Supervisor / User State : trạng thái cúa người sử dụng / giám sát 

Master / interrupt State : trạng thái của master / ngắt 

Interrupt priority mask : mặt nạ Ưu tiên ngắt 

Extend : mớ rộng 

Negative : âm 

Overflow : tràn 

Carry : nhớ 

Tập các chỉ thị của 68000 được trình bày trong hình 5.15. Đây 
là các chỉ thị dành cho người sử dựng, những chỉ thị chỉ được thực 
thi bởi hệ điều hành không liệt kê ở đây. Ký hiệu scr chỉ ra toán 
hạng không bị thay đổi, ngược lại dst chỉ ra toán hạng bị thay đổi. 
Ngoại trừ chỉ thị MOVẸ, nếu một chỉ thị có cả scr và dst, phải có 1 
toán hạng tham chiếu tới thanh ghi. Chỉ có chỉ thị MOVE có thể có 
2 địa chỉ bộ nhớ chứa các toán hạng ( cả 2 toán hạng đều có thể ở 
trong bộ nhớ ). 

Lưu ý là Motorola chọn trật tự toán hạng khác với Intel cho 
ngôn ngữ hợp dịch tượng trưng ( nghĩa là ASCII ). Trên 680x0, chỉ 
thị 


ADD x,y 
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MOVE src, dst 

Move src to dst 

MOVEA src, An 

Move src to An 

MOVEM src, dst 

Move multiple reglsters to/from memory 

MOVEP src, dst 

Move data to/trom alternate memory bytes 

MOVEQ #n, dst 

Move the constant n to dst (-129<n<128) 

LEA arc, An 

Load ettectlve address ol src to An 

PEA src 

Push effectlve address onto the stack 

CLR src 

Move zero to dst 

EXG dstl, dst2 

Exchange two 32-bit reglsters 



ADD src, dst 

Add src to dst 

ADDA src, An 

Add src to An 

ADDI #n, dst 

Add the constant n to dst 

ADDQ #n, dst 

Add the constant n to dst (0<n<9) 

ADDX src, dst 

Add src and extend bit to dst 

SUB src, dst 

Subtract src from dst 

SUB src, An 

Subtract src (rom An 

SUBI #n, dst 

Subtract the constant n from dst 

SUBQ #n, dst 

Subtract the constant n trom dst (0<n<9) 

SUBX src, dst 

Subtract src and extend blt (rom dst 

MULU src, Dn 

Multiply Dn by src (unsigned) 

MULS src, Dn 

Multiply Dn by src (signed) 

OIVU src, dst 

Divide dst by src (unsigned) 

DIVS src, dst 

Dívide dst by src (signed) 

NEG dst 

Negate dst (subtract it (rom 0) 

NEGX dst 

Subtract dst and the extent bỉt (rom 0 



ABCD src, dst 

Add binary coded decimal numbers 

SBCD src, dst 

Subtract blnary coded decimal numbers 

SBCD dst 

Negate binary coded decimal numbers 



AND src, dst 

Boolean AND ot src into dst 

ANDI #n, dst 

Boolean AND of the constant n Into dst 

OR src, dst 

Boolean OR of src into dst 

ORI #n, dst 

Boolean OR ot the constant n into dst 

EOR src dst 

Boolean exclusive OR ot src into dst 

EORI #n, dst 

Boolean exclusive OR of the constant n into dst 

NOT dst 

Replace dst with its 1s complement 


Hình 5.15 Tập chỉ thị của 68000 
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Hình 5.15 ( tiếp theo ) 
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nghĩa là cộng X với y, trong khi trẽn tất cả các bộ xử lý của Intel lại 
có nghĩa là cộng y với X. 

Một quan điểm ký hiệu khác là việc dùng dâu thăng (#) trong 
một số chỉ thị như là 

ADDI #n, dst 

Chỉ thị này chỉ ra rằng toán hạng phải là một hàng sỏ" nguyên. 
An và Dn được dùng đế cho biết một toán hạng phải là một thanh 
ghi địa chỉ hoặc thanh ghi dữ liệu. Cuối cùng, chỉ thị CMPM dùng 2 
thanh ghi địa chỉ đế định vị các toán hạng và sau đó tăng các 
thanh ghi lẽn. Chúng ta sẽ giải thích ký hiệu sau khi tới phần định 
địa chỉ. 

Cũng như với các CPU của Intel, ta chia các chĩ thị thành các 
nhóm dựa vào chức năng. Nhóm đầu tiên xử lý việc chuyển byte, từ 
và từ dài. Hầu hết các chí thị đều dễ hiểu, trừ chỉ thị MOVEP là chỉ • 
thị làm việc với thiết bị I/O sử dụng các chip ngoại vi cổ xưa. 

2 nhóm kế tiếp là các chỉ thị sô" học trên các sô" nhị phân và 
BCD ( mỗi byte có 2 số [ digit I thập phân ). Một vài biến thể hiện 
diện trong một số chí thị, mỗi một biến thể có một mả khác nhau. 
Thí dụ các chỉ thị ADDI, SƯBI, ADDQ và SƯBQ đều là chỉ thị cộng 
hoặc trừ với một hằng số, nhưng 2 chỉ thị đầu có thể xử lý một 
hằng số bất kỳ, trái lại 2 chỉ thị sau là những chí thị đặc biệt ngắn 
để cộng hoặc trừ các hằng sô' 3-bit. Các chỉ thị đặc biệt này làm cho 
người viêt trình biên dịch bực bội bởi vì thường có hiệu quả hơn, 
chẳng hạn, đế lây 130 ở một nơi nào dó bằng cách cộng 5 với 125 
sau đó chuyến 130 vào đó. 

Kế tiếp là các chỉ thị đại số logic và các chỉ thị dịch / quay, 
chúng hoạt động trên các toán hạng thanh ghi hoặc bộ nhớ. Chúng 
hoàn toàn tương tự với các chỉ thị tương ứng của Intel. Tiếp theo 
các chỉ thị này là vài chỉ thị kiểm tra hoặc so sánh các toán hạng, 
và thiết lập các bit cờ tùy thuộc vào kết quả. 

Nhóm tiếp theo sau xử lý với các chuyển điều khiển. Có cả 2 
loại là chỉ thị rẽ nhánh ( branch ) và chỉ thị nhảy ( jump ), chúng 
khác nhau ơ chỗ cách mà hóa địa chỉ đích. Với các chỉ thị rẽ nhánh, 
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độ dời ( offset ) từ chỉ thị được cho sẵn, trong khi với chỉ thị nhảy, 
một sơ đồ địa chỉ tổng quát hơn được sử dụng. Các thủ tục có thê 
được gọi và trở về từ địa chỉ đó. Các chỉ thị chứa cc đưa vào 16 biến 
thể, với các bit mã điều kiện khác nhau được kiểm tra. Thí du, chỉ 
thị BLT ( branch less than ) nghĩa là rẽ nhánh nếu nhỏ hơn và 
BEQ ( branch equal ) nghĩa là rẽ nhánh nếu bằng, tùy thuộc vào 
kết quả của việc kiếm tra hoặc so sánh trước đó. 

4 chỉ thị Bxxx là các chỉ thị kiểm tra, thiết lập, xóa và thay đối 
các bit riêng rè trong thanh ghi hoặc vị trí ô nhớ 32-bit. Toán hạng 
đầu tiên là 1 hằng sỏ hoặc 1 thanh ghi xác định bit nào được sứ 
dụng và toán hạng thứ 2 nhận dạng toán hạng chứa bit đó. 

Nhóm cuôi cùng là tập hợp các chi thị không thích hợp với các 
nhóm ở trên. Các chỉ thị LINK và ƯNLK là những chỉ thị đặc biệt 
quan trọng, được các trình biên dịch sử dụng để điều khiển thiết 
lập stack dựa trên việc vào và ra khỏi một thủ tục. Đại khái chúng 
tương tự như các chỉ thị ENTER và LEAVE trẽn 80286 và 80386, 
mặc dù chi tiết khác nhau. 

Gần như tất cả các chỉ thị sử dụng các toán hạng đều có thế 
làm việc với các giá trị 8-bit, 16-bit hoặc 32-bit. Chiều dài cùa toán 
hạng được mã hóa trong 1 trường 2-bit bên trong chỉ thị. Vì chỉ cần 
3 trong 4 tổ hợp, nên tổ hợp thứ 4 được dùng cho một chỉ thị hoàn 
toàn khác, điển hình là chỉ thị chỉ có thể. điều khiến 1 toán hạng 
chiều dài đơn. Thí dụ, tổ hợp thứ 4 cho chỉ thị AND là một chỉ thị 
nhân. Hầu như không có một khuôn mầu nào cho việc má hóa các 
chỉ thị. 

Sự khác nhau giữa 68020/68030 và 68000 

Mọi điều đề cập ở trên có thể dùng được cho 68000, 68020 và 
68030. Tuy nhiên, 3 bộ xử lý này không hoàn toàn giống nhau ở 
cấp máy quy ước. Đúng như Intel đà quyết định thêm một sô chỉ thị 
mới vào các bộ xử lý sau, Motorola cũng làm như vậy. 

Những chỉ thị thêm vào hiện diện trên cả 68020 và 68030, các 
chỉ thị được các chương trình của người sử dụng dùng đến liệt kê 
trong hình 5.16. 
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BFxxx scr, #n, Dn 

Các chỉ thị quản lý trường 8-bit 

BKPT #n 

Đưa ra chu kỳ điểm gãy trên bus 

CAS Dm, Dn, scr 

Đồng bộ da xử lý 

CAS2 

Đồng bộ đa xử lý phức tạp 

CHK2 scrl, scr2 

Kiểm tra các biên của dãy và bẫy 

CMP2 scrl, scr2 

Kiểm tra các biên của dãy và thiết lập các cờ 

DĨVƯL scr, dst 

Chia từ dài không dấu 

DIVUS scr, dst 

Chia từ dài có dấu 

EXTB dst 

Mô rộng byte thành từ dài 

ILLEGAL 

Gây ra một bẫy cho chỉ thị không hợp lệ 

MULU.L scr, dst 

Nhân từ dài không dâu 

MƯLS.L scr, dst 

Nhân từ dài có dâu 

PACK Dx, Dy, #n 

Gói 2 digit số BCD trong 1 byte 

RTD #n 

Quay về từ thù tục và giải phóng stack 

TRAPcc 

Bẫy nếu điều kiện đúng 

ƯNPK Dx, Dy, #n 

Mở gói các digid của số BCD từ 1 byte 

cpXXX 

Chí thị đồng xử lý 


Hình 5.16 Những chỉ thị mới dành cho chương trình của người sử dụng 

trên 68020 và 68030 

Một số chỉ thị mới cung cấp các phương pháp thực hiện các thao 
tác hiệu quả hơn như là kiểm tra biên của dãy ( array bound ), thao 
tác với các trường bit, đổi 1 byte thành 1 từ dài, đóng gói ( pack- 
ing ) và mở gói ( unpacking ) các số BCD, trở về từ thủ tục và đồng 
bộ đa xử lý. Không có lệnh nào thực sự là cần thiết nhưng các nhà 
thiết kế chip luôn tìm thây những thôi thúc không cường dược trong 
việc thêm các chỉ thị mới. 

■ i 
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Những chi thị khác dùng đề hiệu chỉnh những vấn đề trong tập 
chỉ thị ban đầu như thiếu chỉ thị nhân và chia 32-bit thực sự. Điều 
này có lẽ dà bị bỏ qua do thiếu vùng chip. 

Chỉ thị BKPT được dùng để thông tin với các bộ phân tích logic 
bên ngoài nôi với bus hệ thông. Các chỉ thị TRAPcc và ILLEGAL 
đều tạo ra các bẫy ( trong chê độ chạy từng bước ), chỉ thị đầu được 
dùng nếu một điều kiện nào đó đúng, chỉ thị sau luôn luôn được 
dùng. Cuối cùng, cpxxx là một nhóm chỉ thị dùng để thông tin với 
bộ đồng xử lý dâu chấm động hoặc với bộ đồng xử lý khác. 

Có 2 chỉ thị, CALLM để gọi một module và RMT để trở về từ 
một module, được thêm vào 68020 nhưng lây ra ở 60830, các công 
ty cũng có thể thay đổi ý kiến của họ. 

Ngoài ra, một số chỉ thị của 68000 có chứa một hằng số 16-bit, 
thí dụ khoảng cách tương đôi đê rẽ nhánh từ chỉ thị hiện tại. Hầu 
hết những chỉ thị này đều được sửa đổi trong 68020 và 68030 đề 
cho phép các hằng sô' 32-bit. Ngoài những điểm đã liệt kẽ ở trên, 
đối với chương trình cua người sử dụng tất cả 3 CPU đều giông 
nhau. Đối với hệ điều hành chúng có một số điểm khác đặc biệt 
trong việc quản lý bộ nhớ và truy cập nhanh. 

5.1.3 So sánh 80386 và 68030 

80386 và 68030 là 2 chip 32-bit quan trọng nhất, ta sẽ so sánh 
chúng để xem xét cách các nhà thiết kế khác nhau đưa ra các quyêt 
định khác nhau. Chúng ta nên bắt đầu bằng cách nói rằng 2 CPU 
này ở cấp máy quy ước giông nhau nhiều hơn là khác nhau. Lướt 
qua 2 tập các chỉ thị ta sẽ thấy rằng chúng có các loại chỉ thị giông 
nhau mặc dù các chi tiết khác nhau. Cả 2 đều có các chỉ thị di 
chuyên dữ liệu, thực hiện các phép toán nhị phân và thập phân, 
thực hiện các phép toán đại sô logic và các thao tác dịch / quay, 
thực hiện các chuyển điều khiển và thao tác với các trường bit. 
80386 có các thao tác trên chuỗi và 68030 có thể di chuyển nhiều 
thanh ghi trong một lệnh, nhưng nhìn chung, hầu hêt tóc chi t t 
trên bộ xử lý này đều có một chỉ thị tương ứng trên bộ xử lý kia. 
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Sự khác nhau chính giữa 2 CPU là việc định địa chỉ. 80386 có 
một không gian địa chỉ được phân đoạn với 16384 segment 
2 3 “-byte. 68030 có 1 segment 2 :i2 byte. Trong lúc ý tướng về một 
không gian địa chí lớn ( địa chỉ dài 48-bit ) lúc đầu nghe có vẻ hấp 
dẫn, cũng có nghĩa là phái có con trỏ dài 48 bit và điều này rất tốn 
kém, hoặc phải có những quy tắc phức tạp để bảo đảm rằng không 
có cấu trúc dữ liệu nào có thể trò ra ngoài segment của dữ liệu. 
Thực tế, không gian địa chỉ của Motorola đủ lớn, vì thế việc thêm 
vào 16 bit nừa khỏng có ý nghĩa lắm. Intel không bao giờ thiết kế 
một CPU như vậy mà không kê đến nhu cầu tương thích với các 
CPU trước kia, tận cùng là 8088. 

Điêm khác nhau kế tiếp thuộc về các thanh ghi. Các thanh ghi 
cùa 80386 không tương đương hoàn toàn. Thí dụ các chỉ thị lặp 
vòng luôn luôn sứ dụng ECX. Trong lúc 80386 tổng quát hơn 80286 
trong cái nhìn này, vần không đơn giản như 68030, tất cả thanh 
ghi địa chí cúa 68030 đều tương đương nhau. Kết quá là các trĩnh 
biên dịch cho 68030 (Jơn giản hơn các trình biên dịch cho 80386, 

Cá 2 CPU đều có thế điều khiển dược các chi thị 8-bit, 16-bit và 
32-bit, 68030 thực hiện điều đó một cách dễ dàng : 1 trường 2-bit 
trong chỉ thị cho biết kích thước. 80386 chỉ có 1-bit để chọn byte 
hoặc từ. Hoặc “ từ “ có nghía là từ 16-bit hoặc có nghĩa là từ 32-bit 
tùy thuộc vào loại segment và có hay không có tiền tô' trước chỉ thị. 
Sơ đồ của Intel không hay lắm nhưng trong thực tế lại hiệu quả hơn 
vì có ít chương trình trên một máy 32-bit cần đến các từ 16-bit. 

Phương pháp thực hiện I/O cũng khác nhau giữa 80386 và 
68030. 80386 có các chỉ thị rõ ràng cho thao tác đọc và ghi các port 
xuất / nhập. 68030 không có, dựa vào xuât / nhập ánh xạ bộ nhớ. 
Xuất / nhập ánh xạ bộ nhớ hơi tổng quát hơn vì một chỉ thị bất kỳ 
cũng có thể được dùng để đọc hoặc ghi một thanh ghi của I/O, 
nhưng đây chỉ là điểm phụ. 

Điểm khác nhau cuối cùng giữa 2 CPU là sự hiện diện của chế 
độ thực và chế độ ảo trên 80386, 68030 không cần điều này. DI 
nhiên, cá 2 chê độ này chỉ cần đên đế chạy các phần mềm cũ xưa, 
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một chương trình được viết cho 80386 sẽ không bị rắc rôi do việc 
phân biệt các chế độ tạo ra, 

5.2 CÁC KHUÔN DẠNG LỆNH 

Chương trình bao gồm một chuỗi các chỉ thị, mỗi chỉ thị xác 
định một động tác cụ thể nào đó. Một phần ciia chì thị được gọi là 
mã thao tác ( operation code ) hoặc opcode cho biết động tác gì được 
thực hiện. Nhiều chỉ thị chứa hoặc chỉ rõ vị trí của dữ liệu được chỉ 
thị sử dụng: Thí dụ chỉ thị so sánh 2 ký tự xem chúng có giống 
nhau không cần phải xác định rõ các ký tự nào được so sánh. Vấn 
đề chung cho biết các toán hạng ở đâu được gọi là định dịa chỉ hay 
địa chỉ hóa hay đánh địa chỉ ( addressing ) sẽ được thảo luận trong 
phần 5.3. 

Hình 5.17 trình bày vài khuôn dạng ( format ) tiêu biểu cho các 
chỉ thị cấp 2. Trên một số máy cấp 2, tất cả các chỉ thị có cùng 
chiều dài ; trên một sô máy khác có thề có 2 hoặc 3 chiều dài khác 
nhau. Hơn nừa các chỉ thị có thể có chiều dài ngắn hơn, bằng hoặc 
dài hơn chiều dài của 1 từ. 



Hình 5.17 3 khuôn dạng chỉ thị tiêu biếu : (a) Chỉ thị không địa chỉ 

(b) Chỉ thị 1 dịa chỉ (c) Chỉ thị 2 địa chi 

Một sô' quan hệ giừa chiều dài của chỉ thị và chiều dài của từ 
được trình bày trong hình 5.18. 
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■ 1 word 


-1 word 


Address 
0 
1 
2 
3 


Address 


Instruction 

0 

Instructlon 

Inatructlon 

Instructlon 

Inatructlon 

Instructlon 

1 

Instruction 

Instructlon 

Instruction 

Instruction 

tnstructlon 

2 

Instruction 

Inetructton 

Instructlon 

Instruetlon 

Instructlon 

3 

Instructlon 

Instructlon 

Inatructlon 

Instructlon 


<a> 


(b) 


Address Address 


0 

Instructlon 

0 

Instructlon 

Instruction 

Instructlon 

Instmction 

1 

Instructlon 

1 

Instructlon 

Inatructlon 

2 

2 

Instruction 

Instructlon 

Insừuctlon 

3 

Instructlon 

3 

Instruction 

Instruction 

Instructlon 

4 


4 

Instruction 

Instructlon 

Instructlon 

s 

Instructlon 

5 

Instructlon 

Instructlon 

6 


6 

Instruction 

7 

Instruction 

7 

Instructlon 

Instructlon 


(c) 


(dí 


Hình 5.18 Một số quan hệ giữa chiều dài chỉ thị và chiều dài từ. 

ỗ.2.1 Các tiêu chuẩn thiết kế khuôn dạng ỉệnh 

Khi nhóm thiết kế máy tính phải chọn một khuôn dạng lệnh 
( instruction íbrmat ), họ phải xét nhiều yếu tố. Trước tiên và cũng 
quan trọng nhát, các chi thị ngắn tốt hơn các chỉ thị dài. Một 
chương trình bao gồm n chỉ thị 16-bit sẽ chỉ chiẹm phân nửa không 
gian bộ nhớ so với n chỉ thị 32-bit. Các bộ nhớ không trống nhiều 
do vậy các nhà thiết kế không muốn tiêu phí chúng. 

Lý do thứ 2 là mỗi bộ nhớ có một tôc độ truyền riêng được xác 
định bởi công nghệ và kỹ thuật thiết kế bộ nhớ. Tốc độ truyền của 
bộ nhớ là sô' bit dọc ra khỏi bộ nhớ trong 1 giây. Bộ nhớ tốc độ 
nhanh có 'thể cung cấp cho bộ xử lý ( hoặc thiết bị I/O ) nhiều bit 
hơn cho mồi giây so với bộ nhớ tốic độ chậm. 

Nếu tốc độ truyền của một bộ nhớ cụ thể là t bps và chiều dài 
lệnh trung bình là r bit, bộ nhớ có thể phát tối đa t / r chỉ thị mỗi 
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giây. Vì vậy, tốc độ mà các chỉ thị được thực thi ( nghĩa là tốc dộ 
của bộ xử lý ) tùy thuộc vào chiều dài của chỉ thị. Các chỉ thị ngắn 
hơn cũng có nghĩa là bộ xử lý có tốc độ nhanh hơn. Nếu thời gian 
cần để thực hiện chỉ thị dài hơn so với thời gian tìm nạp chỉ thị từ 
bộ nhớ, thời gian tìm nạp sẽ không quan trọng. Tuy nhiên, với các 
CPU có tốc độ nhanh, bộ nhớ thường là một cổ chai. Do vậy, việc 
gia tăng số chỉ thị được tìm nạp mỗi giây là tiêu chuẩn thiết kế 
quan trọng. 

Đủ không gian trong chỉ thị đế diễn tả tất cả thao tác mong 
muôn là tiêu chuẩn thiết kế thứ 2 cho khuôn dạng lệnh. Một CPU 
với 2 n thao tác không thể có kích thước chỉ thị nhò hơn n bit. Đơn 
giản là sẽ không đủ chỗ trong opcode để xác định chỉ thị nào cần 
đến. 

Tiêu chuẩn thiết kế thứ 3 là chiều dài từ của máy phải là bội số 
nguyên của chiều dài ký tự. Nếu mã ký tự có k bit, chiều dài từ 
phải là k , 2k, 3/e, 4/e, ... ; ngược lại, không gian bộ nhớ sẽ bị phí 
phạm khi cất các ký tự. Dĩ nhiên có thể chứa 3.5 ký tự mỗi từ, 
nhưng làm như vậy sẽ gây cho hệ thông làm việc không có hiệu quả 
trong việc truy xuất ký tự. Những hạn chế về chiều dài từ bởi mà 
ký tự ảnh hưdng đến chiều dài chỉ thị, do bởi hoặc chỉ thị sẽ chiếm 
một sô' nguyên các byte hoặc từ, hoặc một sô' nguyên các chỉ thị đặt 
vừa trong một từ. Một thiết kế với một ký tự 9-bit, một chỉ thị 12- 
bit và một từ 32-bit sẽ là một thảm họa lớn. 

Tiêu chuẩn thiết kế thứ 4 liên quan đến sô' bit trong một trường 
địa chỉ. Hãy xét thiết kê' của một máy có ký tự 8-bit ( có thể là 7 
bit cộng với 1 bit chẵn lẻ ) và một bộ nhớ chính chứa 2 16 ký tự. Các 
nhà thiết kế có thể chọn để ấn định các địa chỉ liên tiếp với các 
đơn vị 8, 16, 32 bit cũng như những khả năng khác. 

Điều gì sẽ xảy ra nếu nhóm thiết kê chia thành 2 phái, một 
phái úng hộ việc tạo ra đơn vị cơ bản của bộ nhớ là byte 8-bit và 
phái kia ủng hộ việc dùng từ 32-bit. Nhóm đầu đề xuât một bộ nhớ 
2 16 byte đánh sô' từ 0, 1, 2, 3, ..., 65535. Nhóm sau đề xuất một bộ 
nhớ 2 14 từ đánh sô' từ 0, 1, 2, 3, .... 16383. 
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Nhóm đầu muốn chí ra rằng đề so sánh 2 ký tự trong cách tổ 
chức theo từ 32-bit, chương trình không chỉ phải tìm nạp các từ 
chứa các ký tự đó mà còn phải rút ra mỗi ký tự từ các từ dể so sánh 
chúng. Thực hiện như thế sẽ làm tốn thêm một sô" chỉ thị phụ và 
như vậy làm phí phạm không gian bộ nhớ. Tổ chức theo byte 8-bit 
sẽ cung câp địa chỉ cho từng ký tự nên việc so sánh sẽ dễ dàng hơn. 

Nhóm dùng từ 32-bit chi ra rằng đề xuât cúa họ chỉ cần 2 U địa 
chi phân biệt nên chiều dài dịa chỉ chỉ có 14 bit, trong khi đề xuất 
byte 8-bit phải cần 16 bit để địa chỉ hóa cùng một bộ nhớ như vậy. 
Địa chỉ ngắn hơn có nghĩa là chiều dài chỉ thị cũng ngắn hơn, 
không chỉ chiếm ít không gian hơn mà thời gian tìm nạp chỉ thị 
cũng ngắn hơn. Khả năng lựa chọn là vẩn duy trì địa chỉ 16-bit để 
tham chiếu bộ nhó 4 lần lớn bằng bộ nhớ mà tố chức 8-bit cho 
phép. 

Thí dụ này chứng minh rằng đê dạt được giải pháp về bộ nhớ 
tốt hơn, người ta phái trà giá bằng các địa chỉ dài hơn và cũng có 
nghĩa là chi thị sẽ dài hơn. Điếm cơ bản trong giải pháp là một tổ 
chức bộ nhớ trong đó mọi bit đều có thể địa chỉ trực tiếp ( thí dụ 
Burroughs B1700 ). Còn giải pháp kia có bộ nhớ bao gồm các từ rất 
dài ( thí dụ loạt máy CDC Cyber có các từ 60-bit ). 

5.2.2 Mở rộng opcode 

Trong phần trước ta đã thấy các giải pháp địa chỉ ngắn và bộ 
nhớ tốt tương phản nhau có thể được thỏa hiệp như thế nào. Trong 
phần này chúng ta sẽ khảo sát các thỏa hiệp giừa opcode và địa chỉ. 
Xét một chỉ thị ( n+k )-bit có opcode /e-bit và địa chỉ tt-bit. Chỉ thị 
này cho phép 2 k thao tác khác nhau và 2 n phẩn tử bộ nhớ địa chỉ 
hóa được. ( n+k )-bit như vậy cũng có thể tách thành opcode 
( k-1 )-bit và địa chi ( n+ĩ )-bit, nghĩa là chỉ có một nửa sô chỉ thị 
nhưng bộ nhớ địa chỉ hóa được tăng gấp 2, hoặc với cùng dung 
lượng bộ nhớ như vậy nhưng độ phân giải tăng gấp 2. Một opcode 
( k+ĩ )-bit và địa chi ( n-ĩ )-bit cho nhiều thao tác nhưng cái giá 
phải trả là hoặc số phần tử địa chỉ được sè nhỏ hơn hoặc dung 
lương bộ nhớ địa chi hóa được cùng như vậy nhưng độ phân giải sẽ 
xấu hơn. Nhửng thỏa hiệp rất phức tạp có thể có được giừa số bỉt 
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của opcode và sô bit cứa địa chỉ cũng tốt. như các thỏa hiệp đơn giản 
hơn vừa mô tả. Sơ đồ sẽ nói đến trong các phần sau được gọi là mớ 
rộng opcode ( expanding opcode ). 

Khái niệm về mỡ rộng opcode sẽ rõ nhất khi xét một thí dụ. 
Xét một máy dùng các chí thị dài 16 bít và địa chì dài 4 bit như 
trình bày trong hình 5.19. Tình huống này sẽ hợp lý đối với máy có 
16 thanh ghi t vì vậy địa chỉ thanh ghi là 4-bit ) trên đó tát cả các 
phép toán số học sử dụng đến. Một thiết kế có thể có là opcode 4- 
bit và 3 địa chỉ trong chỉ thị, cho 16 chỉ thị 3-dịa chi. 


15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 



Opcode Address 1 Address 2 Address 3 


Hình 5.19 Chỉ thị với opcođe 4-bit và 3 trường địa chì 4-bit. 

Tuy nhiên, nếu các nhà thiết kế cần 15 chì thị 3-địa chỉ, 14 chỉ 
thị 2-địa chỉ, 31 chi thị 1-địa chi và 16 chỉ thị không địa chi, họ cỏ 
thể dùng các opcode từ 0 tới 14 cho các các chi thị 3-địa chỉ nhưng 
phiên dịch opcode 15 khác di ( xem hình 5.20 ). 

Opcode 15 nghĩa là opcode được chứa trong các bit từ 8 tới 15 
thay vì từ 12 tới 15. Các bit từ 0 tới 3 và từ 4 tới 7 hình thành 2 
địa chỉ như thường lệ. 14 chi thị 2-địa chỉ đều có 4 bit tận cùng bẽn 
trái là 1111 và các số từ 0000 tới 1101 trong các bit từ 8 tới 11. Các 
chỉ thị với 4 bit tận cùng bên trái là 1111 và các bit từ 8 tới 11 
hoặc là 1110 hoặc là 1111 sẽ được xứ lý đặc biệt. Các chì thị này 
được xử lý như thế là các opcode của chúng ỡ trong các bit từ 4 tới 
15. Kết quả ta có 32 opcode mới. Do bởi chỉ cần 31 opcode, nên 
opcode 111111111111 được phiên dịch để có nghĩa là opcode thực 
trong các bit từ 0 tđi 15, cho 16 chỉ thị không địa chỉ. 

Trong tháo luận này, opcode trờ thành ngày càng dài hơn, 
nghĩa là các chi thị 3-địa chí có opcode 4-bit, các chỉ thị 2-địa chì có 
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16 bKs 


4-blt - 

►15ÕÕ5) 

xxxx 

yyyy 2222 

opcode 

0001 

xxxx 

yỹỹỹ 2222 


0010 

# 

• 

xạx 

yyyv 2222 


• 

1100 

xxxx 

yyyy 2222 


1101 

xxxx 

yyyy zzzz 


1110 

xxxx 

yýýý 2222 


15 3-address 
instructlons 


8-bỉt - 
opcode 


►{1111 

QQ00J yyyy 2222 

1111 

0001 yyyy zzzz 

1111 

• 

■ 

0010 yýýy zzzz 

# 

1111 

1011 yyyy 7777 

1111 

110O yyyy 7777 

1111 

1101 yýýy ZZZ7 


14 2-address 
instructlons 


12-blt - 
opcode 



►(1111 

1110 

0000) zzzz 

1111 

* 

• 

1110 

0001 zzzz 

* 

1111 

1110 

1110 zzzz 

1111 

1110 

1111 zzzz 

1111 

1111 

0000 zzzz 

1111 

* 

1111 

0001 BZZ 

* 

• 

1111 

1111 

1101 zzzz 

1111 

1111 

1110 zzzz 


16-btt 
opeode 


{1111 

1111 

1111 

~õõõữ) 

1111 

1111 

1111 

0001 

1111 

* 

1111 

1111 

0010 

1111 

1111 

1111 

1101 

1111 

1111 

1111 

1110 

1111 

1111 

1111 

1111 

15 12 

11 6 

7 4 

3 0 


31 1-address 
Instructions 


16 0>address 
instructlons 


Blt number 


Hình 5.20 Một mở rộng opcode cho phép có 15 chỉ thị 3 địa chỉ, 14 chỉ thị 
2 địa chỉ, 31 chỉ thị 1 địa chỉ và 16 chỉ thị không địa chỉ. Các trường đánh 
dấu xxxx, yyyy và zzzz là các trường địa chỉ 4-bit. 
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opcode 8-bit, các chỉ thị 1-địa chỉ có opcode 12-bit và các chỉ thị 
không địa chỉ có opcode 16-bit. 

Thực tế việc mở rộng opcode không hoàn toàn dơn giản và bình 
thường như trong thí dụ của chúng ta. Chúng ta đã giả thiết là tất 
cả các toán hạng đều cần 4 bit. Thực ra nhiều khuôn dạng và chiều 
dài khác nhau thường được yêu cầu. 

5.2.3 Thí dụ về các khuôn dạng lệnh 

Trong phần này chúng ta sẽ khảo sát các khuôn dạng lệnh ỡ 
cấp máy quy ước của PDP-11, Intel và Motorola. Chúng ta gộp cả 
PDP-11 vào đây vì tính đơn giản và có quy luật của loại máy này có 
thể soi rọi như là một dự đoán cho những nhà kiến trúc tập các chí 
thị trong tương lai. 

PDP-11 

Đa sô" các chỉ thị 2 toán hạng cua PDP-11 đều được mã hóa như 
trình bày trong hình 5.21. Mỗi chỉ thị chứa một opcode 4-bit và 2 
trường địa chỉ 6-bit. Bit tận cùng bên trái của opcode chỉ rõ chỉ thị 
hoạt động trên byte hay trên từ. Các trường địa chỉ được chia nhỏ 
thành 1 trường kiểu 3-bit và 1 trường thanh ghi 3-bit ( PDP-11 có 8 
thanh ghi ). Các trường kiểu cho biết toán hạng ở trong thanh ghi, 
ở trong bộ nhớ hay là một hằng sô" và v.v... Có thể dùng 8 kiểu 
giông nhau cho toán hạng nguồn và cho toán hạng đích, và bâ"t kỳ 
opcode nào cùng được dùng với một toán hạng nguồn và một toán 
hạng đích nào dó. Một tập chỉ thị trong đó phương pháp xác định 
địa chỉ của toán hạng độc lập với opcode được gọi là trực 
giao ( orthogonai ). Người viết trình biên dịch thích những tập lệnh 
trực giao như vậy. 


Opcode Source operand Destination operand 


^-~-w— 





w ! INSTRUCTION 


MODE 

ỉ REGISTER 

à 

MODE 

REGISTER 

15\ 14 13 12 

' BYTE/WORD 

11 

10 9 

8 7 6 

5 4 

3 2 10 


Hình 5.21 Mã hóa chỉ thị trực giao trên PDP-11 
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Source operand : toán hạng nguồn 
Destination operanđ : toán hạng đích 

Đôi với một vài chỉ thị khác, bao gồm các chỉ thị 1 toán hạng, 
PDP-11 sử dụng một sơ đồ mở rộng opcode, với các opcođe xlll 
( nhị phân ) được dùng như một phương tiện để tránh những opcode 
dài hơn. Cũng vậy, những opcode này có tính quy luật, thí dụ, đa số 
chỉ thị 1 toán hạng đều dùng opcode 10-bit và các trường kiểu / 
thanh ghi 6-bit như các chỉ thị 2 toán hạng. Các chỉ thị của PDP-11 
sứ dụng địa chỉ bộ nhớ có thêm 1 hoặc 2 từ 16-bit theo sau chỉ thị 
đế chí rõ các địa chỉ. 

Họ 8088/80286/80386 của Intel 

Với các CPU của Intel, tình huống hoàn toàn khác và rất ít theo 
quy luật. Nhìn chung, với các chì thị 2 toán hạng, nếu một toán 
hạng ở trong bộ nhớ, toán hạng kia không ơ trong bộ nhớ. Vì vậy 
tồn tại những chi thị cộng 2 thanh ghi, cộng thanh ghi với bộ nhớ 
và cộng bộ nhớ với thanh ghi, nhưng không tồn tại chỉ thị cộng từ 
nhớ này với từ nhớ kia, PDP-11 cho phép điều này như là kết quả 
trực tiếp của tính trực giao. 

Trên 8088 mỗi opcode là 1 byte, nhưng với 80386 các opcode 1- 
byte đều đã được tận dụng hết, vì thế opcode 15 được dùng như là 
phương tiện để đi tới các opcode 2-byte. Cấu trúc duy nhất trong 
trường opcode là việc dùng bit thấp trong một sô chỉ thị để cho biết 
byte / từ và dùng bit kê bên đề cho biết địa chỉ bộ nhớ ( nếu có ) là 
nguồn hay đích. 

Theo sau byte opcode trong hầu hết các lệnh là byte thứ 2 cho 
biêt toán hạng ở đâu, tương tự với 2 trường kiểu / thanh ghi trong 
hình 5.21. Vì chi có 8 bit nên byte thứ hai được chia thành 1 trường 
kiểu 2-bit và 2 trường thanh ghi 3-bit. Như vậy chỉ có 4 cách để địa 
chí hóa các toán hạng ( PDP-11 có 8 ) và 1 trong các toán hạng 
luôn luôn phái là thanh ghi. Một cách logic, một thanh ghi bất kỳ 
trong các thanh ghi AX, BX, cx, DX, SI, DI, BP hoặc SP cần được 
chỉ rỏ như thanh ghi khác, nhưng các quy luật mã hóa cấm một số 
tổ hợp nào đó và dùng chúng cho nhừng trường hợp đặc biệt. 
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Trên 80386, trong các segment 32-bit, các kiểu hoàn toàn khác 
với các kiểu trên 8088 và 80286. Một sô các kiểu này cần thêm 1 
byte, gọi là SIB ( scảỉe, index, base ) để cho thêm một đặc tính kỹ 
thuật nữa. Sơ đồ này không phải là sơ đồ lý tướng nhưng đơn gián 
là vì chúng không còn bit. 

Ngoài ra một số chỉ thị có 1, 2 hoặc 4 byte nữa để xác định địa 
chỉ bộ nhớ và 1, 2 hoặc 4 byte khác được dùng làm toán hạng hằng 
số ( thí dụ dể chuyển sô" 100 vào thanh ghi ). 

Các khuôn dạng chỉ thị của 8088, 80286 và 80386 được cho 
trong hình 5.22. Mỗi chỉ thị có thề có đến 6 trường, mỗi trường có 
tầm từ 0 tới 5 byte. Trên 8088 và 80286, chỉ thị ngắn nhất dài 1 
byte và chỉ thị dài nhất có 9 byte ( kể cá các tiền tỏ" REP, LOCK và 
các tiền tố thay thế segment ). Trên 80386, chỉ thị ngắn nhất vẫn 
dài 1 byte, nhưng với việc cộng thêm các tiền tố, kích thước của 
toán hạng và kích thước của địa chỉ, một chỉ thị có thể dài tới 17 
byte. 


CPU Field lengths (in bytes) 



Hình 5.22 Các khuôn dạng lệnh của Intel 
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Field lengths ( in byte ) : các chiều dài trường ( byte ) 

Instruction íormat : khuôn dạng lệnh 

Which operand is source ? : toán hạng nào là nguồn ? 

Họ 68000/68020/68030 của Motorola 

Việc mã hóa chỉ thị của 68000 biểu hiện sự trái ngược đáng chú 
ý so với cách mã hóa chi thị của PDP-11 và các CPU của Intel. 
Người thiết kế 68000 nghiên cứu kỹ máy PDP-11 và có ảnh hưởng 
đáng kế từ PDP-11, đặc biệt đối với tập chỉ thị và các kiểu định địa 
chi, nhưng khi mả hóa các chỉ thị họ theo con đường khác. Triết lý 
cơ bán đằng sau việc mã hóa chỉ thị của PDP-11 là tính trực giao 
của các opcode và các toán hạng, mặt khác chỉ thị bao gồm 1 trường 
opcođe và 0, 1, hoặc 2 trường toán hạng với các trường toán hạng 
được mã hóa theo cùng một phương thức. 

Với 68000 tình trạng mong muốn này không thề xáy ra. 68000 
có nhiều chỉ thị hơn PDP-11 và có 3 chiều dài dữ liệu ( byte, word, 
long ) thay vì 2 ( byte, vvord ), vì thế các nhà thiết kế không có khả 
năng hoang phí tính trực giao hoặc thậm chí tính có quy luật trong 
việc mã hóa chỉ thị. Việc dồn nén tất cả các chỉ thị trong 16 bit rõ 
ràng là một nổ lực lớn, như vậy không có tổ hợp bit nào bị bỏ phí. 
Kết quả là có ít nhất 18 khuôn dạng { kể cả dấu châm động ), tùy 
thuộc vào nơi ta vẽ một đường thẳng giừa các thay đồi của 1 chỉ thị 
và 2 chỉ thị khác nhau. Từ đầu tiên của một trong các khuôn dạng 
lệnh này được trình bày trong hình 5.23. Giông như PDP-11, nhiều 
chỉ thị có thêm các từ theo sau nhằm cung câp các hằng sô" và các 
địa chi bộ nhớ. 

Thay vì nhờ sự giúp đổ cúa tính trực giao, các nhà thiết kế 
68000 cô gắng cấp phát nhiều không gian opcode cho các chỉ thị 
quan trọng ( nghĩa là thường được sử dụng ) và ít không gian 
opcode cho những chỉ thị không quan trọng. Nhìn chung, phương 
pháp này dẫn đến các chương trình đôi tượng hiệu quả hơn nhưng 
các trình biên dịch lại phức tạp hơn. Chỉ thị MOVE chắc chắn 
là quan trọng nhất trong bất kỳ chương trình nào và được mã 
hóa bằng khuôn dạng 1 với 1 trường kích thước ( 1 = byte. 
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2 = long, 3 = word ) và 2 trường toán hạng 6-bit. Mỗi trường toán 
hạng có một trường kiểu 3-bit và một trường thanh ghi 3-bit, giông 
PDP-11, mặc dù tập các kiểu có thê sử dụng được hơi khác. 68000 
có 16 thanh ghi A và D, không phải là 8, nên không phải mọi kiểu 
đều có thề sử dụng được với mọi thanh ghi ; kiểu xác định rõ hoặc 
thanh ghi A hoặc thanh ghi D. Nếu các bit không quá sít xao, có 
thể các nhà thiết kê 68000 chỉ để chỉ thị MOVE với SIZE = 0 là 
một chỉ thị không hợp lệ để việc mã hóa opcode được đơn giản. 
Điều đó không xảy ra, họ sử dụng SIZE = 0 để mã hóa sự thay đổi 
của các chỉ thị bằng nhiều khuôn dạng khác nhau. 

Chỉ thi MOVE, được cấp phát gần l Á ( 3/16 ) toàn bộ không gian 
opcode, cung cấp 2 trường toán hạng 6-bit cho tất cả các chỉ thị 2 
toán hạng khác không phải bàn thêm nữa. Thay vào đó, hầu hết 
các chỉ thị 2 toán hạng có một trường toán hạng 6-bit 
( OPERAND ) và một trường thanh ghi 3-bit ( REG ) ở khuôn dạng 
2 và 3. Điều này có nghĩa là 68000 có thể cộng thanh ghi với thanh 
ghi, bộ nhớ với thanh ghi hoặc thanh ghi với bộ nhớ nhưng không 
cộng bộ nhớ với bộ nhớ, trong khi PDP-11 thực hiện được. Điềm 
khác nhau duy nhất là Motorola quyết định bỏ 3/16 không gian mã 
hóa để cho phép lệnh MO VE có tính trực giao, Intel thì không. 

Trường MOD ở khuôn dạng 2 phân biệt giữa byte, từ và từ dài; 
trường OPERAND phân biệt giữa nguồn và đích. Bởi vì 3 X 2 = 6 
và 3 bít sinh ra 8 khả năng, 2 giá trị MOD khác được dùng để xác 
định những chỉ thị hoàn toàn khác nhau. 

Một sô' chỉ thị có nhiều khuôn dạng. Thí dụ các chỉ thị dịch và 
quay, có 1 biến thể, khuôn dạng 8, với một hằng sô đêm sô lần dịch 
{ COUNT ) là một phần của lệnh, và một biến thể khác, khuôn 
dạng 5, trong đó sô' đếm được lấy từ một thanh ghi xác định. Các 
khuôn dạng 7 và 9 tồn tại do bởi nhiều nghiên cứu cho thây rằng 
hầu hết các hằng số xuất hiện trong chương trình đều nhỏ. Khuôn 
dạng 7 cho phép một hằng sô 8-bit được nạp vào thanh ghi chỉ 
bằng một chỉ thị 16-bit, Khuôn dạng 9 cho phép một số trong tầm 
từ 1 tới 8 được cộng hoặc trừ với một toán hạng một cách hiệu quả. 
Để cộng 9 với một thanh ghi, chỉ thị ADDI ( khuôn dạng 13 ) được 
cần đến với một từ phụ 16-bit chứa hằng số 9. 
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1 

2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 

13 

14 

15 

16 

17 

18 


MOVE 

ADD, AND, CHP, SU8 
CHK, DIVS, LEA, MULS 
MOVEP 

ASL, ASR, ROL, ROR 
ABCD, EXG, SBCD 
MOVEQ 

ASL, ASR, ROL, ROR 

ADDQ, SUBQ 

Scc 

Bcc 

DBcc 

ADDI, CHPI, NEG, TST 
MOVEM 

JMP, JSR, NBCD, PEA 
TRAP 

EXT, LINK, SWAP, UNUNK 
NOP, RESET, RTS, TRAPV 


OPCODE OP determine insĩruction 
OPERAND dedermines data operated on 
REG selects a register 
SI2E chooses byte, word, long 

MOD determines if operand is source or destination, and lenght 
COUNT, DATA are constants in the range 1-8 
CONDITION specities one of 16 possible conditions to test 
piSPLACEMENT is signed offset for branches 
VECTOR speciíies where to trap 


Hình 5.23 Các líiH/n lạng k '* iử dụng trên 68000 
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OPCODE, OP xác định chỉ thị 
OPERAND xác định dữ liệu 
REG chọn thanh ghi 
SIZE chọn byte, từ, từ dài 

MOD xac dinh toan hạng là nguõn hay đích, và chiều dài 
COƯNT, DATA là các hằng số trong tầm từ 1 đến 8 
CONDITION xác định 1 trong 16 điều kiện đế kiểm tra 
DISPLACEMENT là độ dời có dâu cho các rẽ nhánh 
VECTOR xác định vị trí bẫy 



Thoạt nhìn có vẻ các bit từ 12 tới 15 xác định khuôn dạng lệnh 
là hợp lý, nhưng điều đó không đúng bởi vì không phải tất cả 
khuôn dạng lệnh đều có các chỉ thị như nhau. Chia cố định không 
gian opcode thành 16 nhóm lớn bằng nhau sẽ bỏ phí quá nhiều 
không gian mã hóa có giá trị. Thay vào đó, đôi khi cần phải khảo 
sat tât ca 16 bit đê tách biệt 2 chỉ thị không liên quan nhau. 

Một thí dụ về ảnh hưởng này là cách phân biệt lệnh Scc 
( khuôn dạng 10 ) và Dbcc ( khuôn dạng 12 ) với ADDQ và 
SƯBQ ( khuôn dạng 9 ). Tất cả 4 chỉ thị đều có giá trị 5 ớ 4 bit cao, 
như trình bày trong hình 5.24. Hai chỉ thị sau sè dề dàng phán biệt 
với 2 chỉ thị trước do sự có mặt của trường không hợp lệ SIZE = 3 
( đoi VƠI cac chi thi ADDQ và SUBQ, việc mã hóa chiều dài tùy 
thuộc vào một lý do đặc biệt ; trái với chỉ thị MOVE, 0 = byte, 1 = 
từ, 2 = từ dài, 3 = không hợp lệ ). Phân biệt Scc với Dbcc đòi hỏi 
phải Cẩn thẩn bởi vì tất cả 16 điều kiện đều hợp lệ cho cả 2. Giải 
pháp được chọn là câm MODE = 1 trong Scc. 


15 14 13 12 11 10 9 0 


0 

1 

0 

1 

Data 

0 

Size 

Mode 

Reg 

0 

1 

0 

1 

Data 

1 

' Size 

Mode 

Reg 

0 

1 

0 

1 

Condltion 

1 

1 

Mode 

Reg 

0 

1 

0 

1 

Condition 

1 

1 

0 0 1 

Reg 


ADDO 

SUBQ 

s ce 

DB CC 


Hình 5.24 4 chỉ thị cùa 68000 
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Mặc đù cách làm như vậy không hay lắm nhưng vẫn tồn tại kể 
cả trong bất kỳ sự kiện nào minh họa được các vấn đề có thể nảy 
sinh khi người ta muôn gộp nhiều thông tin trong một số bit giới 
hạn. 

Vấn đề mã hóa trên 68020 và 68030 thậm chí xâu hơn nhiều do 
cần phải hổ trợ tất cả chỉ thị của 68000 và một sô" chỉ thị mới. 
Những chỉ thị mới này bị dồn nén vào chỗ này hay chỗ khác, ở bất 
cứ nơi nào có một tổ hợp bit tự do. Sự mã hóa này không chỉ đưa 
đến những trình biên dịch và những trình dịch hợp ngữ phức tạp, 
chúng phải tạo ra những khuôn dạng đặc biệt, mà còn dẫn đến các 
vi chương trình luẩn quẩn, chúng phải chia cắt các khuôn dạng 
trong lúc thực hiện. Đó là cái giá của sự phát triển. 

5.3 ĐỊNH ĐỊA CHỈ 

Các chỉ thị có thể được phân loại theo sô" địa chỉ sử dụng. Nên 
nhớ rằng tập các thanh ghi được đánh sô" của CPU thực tế hình 
thành một bộ nhớ tốc độ cao và xác định một không gian địa chĩ. 
Một chỉ thị cộng thanh ghi 1 với thanh ghi 2 được xếp vào loại có 2 
địa chỉ bởi vì chỉ thị phải xác định các thanh ghi nào tham gia vào 
phép cộng, giông như chỉ thị cộng 2 từ nhớ phẩi cho biết các từ nhớ 
nào được cộng. 

Một cách tổng quát, các chỉ thị có thể có 1, 2 và 3 địa chỉ. Trên 
nhiều máy, việc thực hiện phép toán sô" học chỉ có 1 địa chỉ và 
người ta sử dụng 1 thanh ghi đặc biệt gọi là thanh chứa ( accu- 
mulator ), thanh ghi này cung cấp 1 toán hạng. 

Trên những máy này địa chỉ thường là địa chỉ của từ nhớ m, ở 
đó toán hạng được định vị. Chỉ thị cộng xác định địa chỉ m có kết 
quả là 

Accumulator : = accumulator + memory[m] 

Các chĩ thị cộng có 2 địa chỉ sử dụng một địa chĩ là nguồn và 
dịa chỉ kia là đích. Sau đó cộng nguồn với đích : 

Destination : = destination + source 
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Các chỉ thị có 3 địa chỉ cho biết 2 nguồn và một đích. Nội dung 
của 2 nguồn được cộng với nhau và cất kết quả vào đích. 

Chúng ta đã ít chú ỷ đến cách các bit của một trường địa chỉ 
được phiên dịch để tìm toán hạng. Một khả năng là chúng chứa địa 
chỉ bộ nhớ của toán hạng. Tuy nhiên, cũng có những khả năng khác 
và trong phần tiếp theo chúng ta sẽ khám phá ra điều đó. 

5.3.1 Định địa chỉ tức thời 

* 

Cách đơn giản nhất để một chỉ thị xác định 1 toán hạng là 
phần địa chỉ của chỉ thị chứa chính toán hạng đó, không phải là địa 
chỉ hoặc thông tin khác mô tả toán hạng đó ở đâu. Một toán hạng 
như vậy được gọi là toán hạng tức thời ( immediate operand ) bởi vì 
toán hạng được tìm nạp tự động từ bộ nhớ cùng lúc với chỉ thị và 
được sử dụng ngay lập tức. 

Định địa chỉ tức thời ( immediate addressing ) có công dụng 
không yêu cầu một tham chiếu bộ nhớ để tìm nạp toán hạng. Điểm 
bất lợi là toán hạng bị giới hạn bởi một số đặt vừa trong một 
trường địa chỉ. Trong một chỉ thị với địa chỉ 3-bit ( nghĩa là trường 
thanh ghi ), giới hạn của các toán hạng là 3 bit, hạn chế những lợi 
điểm của cách định địa chỉ này. 

Các CPU của Intel không có kiểu định địa chỉ cho các toán hạng 
tức thời. Thay vào đó, chúng có một tập lớn các chĩ thị phân biệt 
trong đó một trong hai toán hạng là tức thời. Thí dụ trong hình 5.5, 
chỉ thị ADD có vẻ trực giao giống như PDP-11. Thực tế, 9 opcode 
khác nhau sử dụng cho chỉ thị ADD, 5 trong sô' đó cho phép có toán 
hạng tức thời, tùy thuộc vào cách chỉ ra đích và chiều dài của toán 
hạng tức thời ( 8, 16 hoặc 32 bit). 

680x0 có kiểu định địa chỉ tức thời, một toán hạng nguồn bâ't kỳ 
có thể là hằng sô'. Trên 68000, một sô' chỉ thị chỉ cho phép hằng sô' 
là 8-bit hoặc 16-bit, nhưng trên 68020 và 68030 cả 3 loại chiều dài 
đều được phép. Ngoài ra, các chĩ thị đặc biệt như ADDI, ADDQ và 
CMPI cho phép các chỉ thị tức thời để được mã hóa một cách hiệu 
quả hơn. 
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5.3.2 Định dịa chỉ trực tiếp 

Phương pháp đơn giản khác để xác định một toán hạng là cung 
câp địa chỉ cúa từ nhớ chứa toán hạng. Dạng này được gọi là định 
địa chỉ trực tiếp ( direct addressing ). Chi tiết về cách thức máy 
tính nhận biết địa chỉ nào là tức thời, địa chỉ nào là trực tiếp sẽ 
được thảo luận sau. Một cách tổng quát, có 2 phương pháp : sử dụng 
các opcode khác nhau hoặc sử dụng một kiểu định địa chỉ đặc biệt 
cho mỗi loại toán hạng. 

Các CPU cùa Intel dều có định địa chỉ trực tiếp. 8088 và 80286 
sử dụng các địa chi trực tiếp 16-bit. 80386 sử dụng các địa chỉ 16-bit 
ớ các chế độ thực và ảo, các segrnent 16-bit ờ chế độ bảo vệ. Trong 
chế độ bảo vệ 32-bit, các địa chỉ trực tiếp dài 32-bit. Lưu ý là trong 
mọi trường hợp, các địa chỉ trực tiếp đều không bao trùm toàn bộ 
không gian địa chi. 

680x0 có 2 dạng định địa chỉ trực tiếp, một dạng với địa chỉ 16- 
bit và một dạng với địa chỉ 32-bit. Các địa chỉ trong 64K đầu tiên 
của bộ nhớ được tham chiếu bằng dạng ngắn trong khi các địa chỉ 
trên 64K cần dạng dài. Cả 2 dạng này được xác định bởi các giá trị 
trong trường MOD 3-bit, và do vậy áp dụng cho tất tả các chỉ thị có 
1 hoặc nhiều trường OPERAND trong hình 5.23. 

5.3.3 Định địa chỉ thanh ghi 

Khái niệm định địa chỉ thanh ghi cũng giông như định địa chỉ 
trực tiếp. Trong dạng định địa chỉ này, {rường địa chỉ chứa sô' của 
thanh ghi lưu giừ toán hạng. Một máy với 16 thanh ghi và 65536 từ 
nhớ thực sự có 2 không gian địa chỉ. Người ta nghĩ đến một địa chỉ 
trên một máy như vậy có 2 phần : (a) một-bit cho biết thanh ghi 
hoặc từ nhớ và (b) một trường địa chỉ cho biết thanh ghi nào hoặc 
từ nhớ nào. Do có ít thanh ghi hơn từ nhớ nên cần địa chỉ nhỏ hơn 
và như vậy các chỉ thị có dạng khác nhau thường được dùng cho các 
toán hạng thanh ghi và cầc toán hạng bộ nhớ. 

Nếu có một chỉ thị thanh ghi tương ứng với mỗi một chỉ thị bộ 
nhớ, một nửa số opcode dành cho các toán hàng bộ nhớ và một nửa 
dành cho các toán hạng thanh ghi. Một bít trong opcode dược cần 
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đến để chỉ rõ không gian địa chỉ nào được sử dụng. Nếu sau đó bit 
được loại bỏ khỏi trường opcode và được đặt vào trường dịa chỉ, việc 
sử dụng 2 không gian địa chỉ sẽ rõ hơn. Bit sẽ cho biết không gian 
địa chỉ nào được sử dụng. 

Các máy được thiết kế với các thanh ghi vì 2 lý do : (a) các 
thanh ghi nhanh hơn bộ nhớ chính và (b) bởi vì có quá ít thanh ghi 
nên chỉ cần ít bit để dịa chỉ hóa chúng. Đáng tiếc là có 8 hoặc 16 
thanh ghi cũng làm phức tạp cho việc lập trình do bởi phải tạo ra 
nhiều quyết định như : các toán hạng nào, các kết quả trung gian 
nào được giữ trong sô' thanh ghi giới hạn đó và các toán hạng nào, 
các kết quả trung gian nào được giữ trong bộ nhớ chính. w. L. van 
der Poel (1968) đã nhận xét một cách tinh tế, các máy tính phải 
được cung cấp hoặc 0, 1 hoặc một sô" vô hạn cho mỗi đặc tính ( vô 
hạn có nghĩa là nhiều đủ đế người lập trình không cần phải tôn 
thời gian suy nghĩ phải làm gì nếu điều gì đó đã được dùng hết ). 

Cả 2 chip Intel và Motorola đều có một lượng lớn các chỉ thị lây 
các toán hạng từ các thanh ghi và đặt kết quả vào một thanh ghi. 

5.3.4 Định địa chỉ gián tiếp 

Định địa chỉ trực tiếp là sơ đồ trong đó địa chỉ cho biết từ nhớ 
nào hoặc thanh ghi nào chứa toán hạng. Định địa chỉ gián tiếp là 
sơ đồ trong đó địa chỉ cho biết từ nhớ nào hoặc thanh ghi nào chứa 
địa chỉ của toán hạng. Thí dụ xót một chỉ thị nạp một thanh ghi 
( chúng ta sẽ gọi là thanh ghi RI ) gián tiếp từ vị trí nhớ 1000, nội 
dung tại vị trí 1000 là 1510 như trình bày trong hình 5.25(b). 

Trước tiên, nội dung tại vị trí 1000 được tìm nạp vào một thanh 
ghi nội của CPU. Nội dung 16-bit này ( 1510 ) không được đặt trong 
thanh ghi Rl. Nếu 1510 có trong Rĩ, như hình 5.25(a), ta có chỉ thị 
địa chỉ trực tiếp. Thay vào đó, nội dung của vị trí 1510 được tìm 
nạp và đặt vào Rl. Nội dung ở vị trí 1000 không phẩi là toán hạng 
mà trỏ tới toán hạng và vì lý do này, ta gọi là con trỏ ( pointer ). 

Các bộ xứ lý của Intel đều có định địa chỉ gián tiếp thông qua 
thanh ghi. Thí dụ có thể đặt con trỏ trong SI và chỉ ra rằng toán 
hạng đặt trong bộ nhớ tại địa chi được trỏ tới bởi SI. Trên 8088 và 
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80286, chỉ có BX, BP, SI và DI được sử dụng trong kiểu định địa chỉ 
giản tiếp; trên 80386 tất cả các thanh ghi đều có thể sử dụng được 
cho kiểu định địa chỉ này. Định địa chỉ gián tiếp dùng con trỏ trong 
bộ nhớ không thực hiện được trên bất kỳ thanh ghi nào. 

68000 cho phép định địa chỉ gián tiếp thông qua các thanh ghi 
địa chỉ và không có dạng định địa chỉ gián tiếp nào khác. Trên 
68020 và 68030 định dịa chỉ gián tiếp còn có dạng thông qua bộ 
nhớ. Đây là một trong những khác nhau chính giữa 68000 và các 
CPU sau này. 

Một số máy cho phép định địa chỉ gián tiếp nhiều cấp. ơ kiểu 
định địa chỉ này, người ta dùng một con trỏ dể định vị một từ nhớ 
và chính từ nhớ này trỏ tới một từ nhớ khác, và v.v... 

Địa chỉ tức thời, trực tiếp, gián tiếp và địa chỉ gián tiếp nhiều 
câp biểu diễn một sự tiến triển trong việc định địa chỉ. Định địa chỉ 
tức thời không cần tham chiếu bộ nhớ vì toán hạng được tìm nạp 
cùng lúc với lệnh. Định địa chỉ trực tiếp cần một tham chiếu bộ nhớ 
đế tìm nạp toán hạng. Định địa chỉ gián tiếp cần 2 tham chiếu bộ 
nhớ, một cho con trỏ và một cho toán hạng. Định địa chỉ gián tiếp 
nhiều cấp cần ít nhất 3 tham chiếu bộ nhớ, 2 hoặc nhiều tham 
chiếu cho con trỏ và một cho toán hạng. Các tham chiếu bộ nhớ 
trong ngữ cảnh này gồm các tham chiếu thanh ghi*. 

5.3.5 Định chỉ sô" 

Nhiều thuật toán cần thực hiện một thao tác nào đó trên một 
chuỗi cấu trúc dử liệu lưu giữ trong những vị trí nhớ liên tiếp. Thí 
dụ xét một khối n từ máy chiếm các vị trí 

A, A+l, A+2,...» A+n-1 

các từ này phải được chuyển đến các vị trí 

B, B+l, B+2,..., B+n-1 
Giá thiết rằng máy có chỉ thị 


MOVE A,B 
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chuyển nội dung của vị trí A tới vị trí B, người ta có thể thực thi chỉ 
thị này và thay đổi trên chính chỉ thị thành 

MOVE A+l, B+l 

thực thi chỉ thị lần nữa, sau đó lại thay đổi chỉ thị lần nữa và lặp 
lại cho tới khi tất cả n từ được sao chép hết. 

Mặc dù các chương trình tự thay đổi được dùng phổ biến trước 
kia, nhưng nay được xem như một phương cách lập trình dở. Các 
chương trình như vậy khó sửa sai và làm khó khán cho việc dùng 
chung một chương trình giữa nhiều người sử dụng trong hệ thông 
phân chia thời gian. 

Vấn đề sao chép cũng có thể được giải quyết bằng định địa chỉ 
gián tiếp. Một thanh ghi hoặc một từ nhớ được nạp với địa chỉ A ; 
một thanh ghi hoặc một từ nhớ thứ 2 được nạp với địa chỉ B. Lệnh 
MOVE dùng 2 thanh ghi này làm các con trỏ. Sau mỗi lần sao chép 
một từ, các con trỏ được tăng thêm 1. Các con trỏ là một phần của 
dữ liệu, không phải là phần của chương trình và những người sử 
dụng không được dùng chung đồng thời. 

Một giải pháp khác là có một hoặc nhiều thanh ghi, gọi là 
thanh ghi chỉ sô' ( index register ) hoạt động như sau. Địa chỉ có 2 
phần : sô' của một thanh ghi chỉ sô' và một hằng sô. Địa chỉ của 
toán hạng là tổng của hằng số với nội dung của thanh ghi chỉ sô. 
Trong thí dụ trước, nếu cả hai địa chỉ được định chỉ sô bằng cách 
dùng một thanh ghi chỉ sô chứa sô nguyên k, chỉ thị MOVE A, B sẽ 
chuyển nội dung của vị trí nhớ A+/e tới B+k. Bằng cách khởi động 
thanh ghi chỉ sô' là 0 và tăng nội dung thanh ghi này lên một lượng 
bằng kích thước của từ sau khi sao chép một từ, chỉ cần một thanh 
ghi cho vòng lặp sao chép. Hơn nữa, việc tăng thanh ghi sè nhanh 
hơn việc tăng một vị trí nhớ. 

Định chỉ số ( indexing ) cũng thường được dùng để định địa chỉ 
một trường có offset đã biết từ vị trí bắt đầu một cấu trúc đã cho. 
Các biến cục bộ trong một thủ tục cũng được truy xuất th’eo phương 
pháp này. 
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Direct Addressing 



Indirect Addressịng 



Pointer 


step 2: 

The operand is 
Ịetched from 
location 1510 


Hình 5.25 So sánh địa chi trực tiếp và địa chí gián tiếp 

tiếp (b) Địa chỉ gián tiếp 


(a) Địa chỉ trực 
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Direct addressing : định địa chỉ trực tiếp 

Instruction : load RI from 1000 : chi thị : nạp Rl từ địa chỉ 1000 

Fields speciíying direct addressing : trường chí ra kiểu định địa chi trực 

tiếp 

Step 1 : The operand is ĩetched from location 1000 : bước 1 : toán hạng 
được tìm nạp từ vị trí 1000 

Step 2 : The operand is loaded into Rl : bước 2 : toán hạng được nạp vào 
RI 

Indirect ađdressing : định địa chi gián tiếp 

Instruction : load Rl indirectly from 1000 : chỉ thị : nạp RI gián tiếp từ địa 
chỉ 1000 

Fields specifying indirect adđressing : trường chỉ ra kiểu định địa chỉ gián 
tiếp 

Step 1 : The pointer to the operand is fetched from ỉocation 1000 : bước 1 : 
con trỏ trỏ tới toán hạng được tìm nạp từ vị trí 1000 

Step 2 : The operand is íetched from 1510 : bước 2 : toán hạng được tìm 
nạp từ vị trí 1510 

Step 3 : The operand is loaded into RI : bước 2 : toán hạng được nạp vào 

RI 

Trong thí dụ đã cho ơ trên, người ta cần tăng thanh ghi chi sô' 
một lượng đúng bằng kích thước của từ sau mổi lần sứ dụng. Nhu 
cầu tăng hoặc giảm thanh ghi chỉ sô ngay trước hoặc sau khi sứ 
dụng rất phổ biến nên một số máy tính cung câ'p những chi thị 
hoặc các kiểu định địa chỉ dặc biệt hoặc thậm chí các thanh ghi chi 
số đặc biệt tự động tăng hoặc giảm. Sự thay đối tự động của một 
thanh ghi chỉ sô' được gọi là tự định chỉ sô' ( autoinđexing ). 

Cả 2 chip của Intel và Motorola đều có nhiều kiểu định địa chỉ 
khác nhau bao gồm định chỉ số. 680x0 cũng có kiểu tự định chi số. 

5.3.6 Dịnh địa chỉ stack 

Chúng ta đả lưu ý rằng việc tạo ra các chi thị máy càng ngắn 
ràng tiết kiệm bộ nhớ và thời gian của CPU. Giới hạn cuôi cùng của 
việc giảm chiều dài địa chỉ sẽ dẫn đến các chỉ thị không có địa chỉ, 
chỉ có opcode. Đây là điều có thể xảy ra bằng cách tổ chức máy 
xung quanh một cấu trúc dữ liệu gọi là stack. 
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Stack bao gồm các phần tử dừ liệu ( từ, ký tự, bít, v.v... ) được cất 
theo một trật tự liên tiếp trong bộ nhớ. Phần tử đầu tiên được cất 
vào stack sẽ ở đáy của stack. Phần tử gần nhất được cất vào stack 
sẽ ở đỉnh của stack. Kết hợp với mỗi một stack là một thanh ghi 
hoặc từ nhớ chứa địa chỉ của đỉnh stack, được gọi là con trỏ stack 
( stack pointer ). 

Mặc dù đã thảo luận về stack ở chương 4, chúng ta cũng sẽ ôn 
lại ở đây bởi vì việc sử dụng stack cho các phép toán số học hoàn 
toàn khác với việc sử dụng stack để lưu giữ các biến cục bộ ( dĩ 
nhiên có thê dùng kết hợp cả 2 ). Hình 5.26 minh họa hoạt động 
của stack. Trong hình 5.26(a) đã có 2 phần tử trong stack. Đáy củâ 
stack ở vị trí nhớ 1000 và đỉnh của stack ở vị trí nhớ 1001. Con trỏ 
stack chứa địa chỉ của phần tử trên đỉnh stack, tức là 1001 ; nghĩa 
là trỏ tới đỉnh của stack. Trong hình 5.26(b), 6 được cất vào stack 
và con trỏ stack chứa 1002 là đỉnh mới của stack. Trong hình 
5.26(c), 75 được cất lên stack, tăng con trỏ stack lên 1003. Trong 
hình 5.26(d), 75 được lấy ra khỏi stack. 

Các máy tính hướng stack ( stack-oriented ) có chỉ thị cất 
( push ) các nội dung của vị trí nhớ hoặc thanh ghi vào stack. Một 
chỉ thị như vậy phải thực hiện việc sao chép phần tử đó và tăng con 
trỏ stack. Tương tự, chỉ thị lấy ( pop ) đỉnh của stack đưa vào thanh 
ghi hoặc vị trí nhớ phải thực hiện một sao chép mới vào nơi thích 
hợp và giảm con trỏ stack. Một sô' máy tính có stack đảo ngược, với 
những phần tử được cất liên tiếp vào những vị trí thấp hơn của bộ 
nhớ thay vì cất liên tiêp vào những vị trí cao hơn như trong hình 
5.26* 

Các chỉ thị không địa chỉ cũng được sử dụng cùng với stack. 
Dạng định địa chỉ này chỉ ra rằng 2 toán hạng được lấy ra khỏi 
stack, toán hạng này tiếp sau toán hạng kia, phép toán được thực 
hiện ( thí dụ nhân hoặc AND ) và kết quả được cất trở lại vào 
stack. Hình 5.27(a) trình bày một stack có 4 phần tử. Chỉ thị nhân 
tác động lấy 5 và 6 ra khói stack, tạm thời thiết lập lại con trỏ 
stack là 1001, sau đó cất kết quả 30 vào stack như trình bày trong 
hình 5.27(b). Nếu sau đó thực hiện phép cộng, kết quả sẽ như trình 
bày trong hình 5.27(c). 
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(“) (b) íc) (d) 


Hình 5.26 Hoạt động cúa một stack 

Stack pointer : con trỏ stack 
Bottom of the stack : đáy cúa stack 
Top of the Stack : đỉnh cúa stack 



(a) <b) (c) 


Hình 5.27 Sứ dụng stack trong tính toán số học (a) Câu hình ban đầu (b) 
Sau khi thực hiện phép nhân íc) Sau khi thực hiện phép cộng 
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Polish ngược 

Truyền thông từ lâu đời trong toán học là viêt toán tử 
( operator ) ớ giừa các toán hạng, thí dụ X + y, chứ không phải sau 
các toán hạng, thí dụ X y +. Dạng toán tử đặt giữa các toán hạng 
dược gọi là ký hiệu infix. Dạng toán tử đặt sau các toán hạng được 
gọi là postfix hay Polish ngược ( reverse Polish ), sau khi nhà logic 
học người Ba Lan J.Lukasiewicz ( 1985 ) nghiên cứu những đặc tính 
cúa ký hiệu này. 

Polish ngược có một sô thuận lợi hơn infix trong việc biểu diễn 
các công thức đại sô. Trước tiên, bất kỳ công thức nào cũng được 
biếu diễn mà không cần dùng các dâu ngoặc. Thứ hai, thuận tiện 
trong việc đánh giá các công thức trên máy tính vởi stack. Thứ ba, 
các toán tử infix có ưu tiên tùy tiện và không mong muôn. Thí dụ ta 
biết rằng axb + c nghĩa là ( a X b ) + c, không phải là a X ( b + c ) 
bởi vì phép nhân được cho tùy ý có ưu tiên cao hơn phép cộng. 
Polish ngược loại bó được điều rắc rói này. 

Có nhiều thuật toán biến đổi các công thức dạng infìx thành 
dạng Polish ngược. Thuật toán dưới đây phỏng theo ý tưởng của 
E.W,Dijkstra. Giá thiết rằng một công thức bao gồm các ký hiệu 
sau : các biến, các toán tử nhị nguyên ( 2 toán hạng ) + - * / và các 
dấu ngoặc trái và phải. Để đầnh dâu các điểm kết thúc của một 
công thức, ta sẽ chèn thêm ký hiệu 1 sau ký hiệu cuối cùng và trước 
ký hiệu đầu tiên. 

Hình 5.28 trình bày một đường xe hỏa đi từ New York tới 
Caỉỉỉbrnia với một cựa sắt ớ giữa các đầu hướng về Texas. Mỗi một 
ký hiệu trong công thức được biểu thị bằng một xe. Đoàn xe hỏa 
chuyển động về phía táy ( sang trái ). Khi mồi một xe đi tới chuyển 
mạch, xe phải dừng lại và được hỏi xem sê đi thẳng tới Caliíornia 
hay đi về phía Texas. Các xe chứa các biến luôn đi thẳng tới 
California và không bao giờ tới Texas. Các xe chứa các ký hiệu 
khác phải hỏi nội dung của xe gần nhất trên đường đi Texas trước 
khi vào chuyền mạch. 
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Hình 5.29 cho thây điều gì xáy ra tùy thuộc vào nội dung của xe 
gần nhất trên đường đi Texas và xe ở chuyển mạch. Xe đầu tiên 
mang ký hiệu JL luôn luôn đi về Texas 



Texas 

0 


Hình 5.28 Môi xe biểu thị một ký hiệu trong cóng thức được đổi từ dạng 

infix thành dạng Polish ngược 


m 

o 

E 5! 

11 

£ 2 
5 2 

ff 

II 

ễĩ 

o 


Car at the svvitch 



1 

+ 

- 

X 

/ 

( 

) 

1 

4 

1 

1 

1 

1 

1 

5 

+ 

2 

2 

2 

1 

1 

1 

2 

- 

2 

2 

2 

1 

1 

1 

2 

X 

2 

2 

2 

2 

2 

1 

2 

/ 

2 

2 

2 

2 

2 

1 

2 

( 

5 

1 

1 

1 

1 

1 

3 


Hình 5.29 Bảng quyết định dùng cho giải thuật đổi infix thành Polish 

ngược 

Car at the switch : xe ờ chuyển mạch 

Most recentỉy arrived car on the Texas line : xe đến gần đày nhất trên 
đường đi Texas 
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Các chữ sô ám chỉ các tình huông sau : 

1. Xe ở chuyển mạch chuyển hướng về phía Texas 

2. Xe gần nhât trên đường đi Texas quẹo trái và đi tới 
Caliíbrnia 

3. Xe ở chuyên mạch và xe gần nhất trẽn đường đi Texas 
đều bị cướp và biến mất. ( nghĩa là cả 2 đều bị xóa ) 

4. Dừng lại. Bây giờ các ký hiệu ở Caliíbrnia biểu thị công 
thức Polish ngược khi dọc từ trái sang phải 

5. Dừng lại. Một lỗi xảy ra. Công thức ban đầu không được 
cân đối đúng. 

Sau mỗi một động tác, một so sánh mới dược thực hiện giữa xe 
ớ chuyên mạch, có thế là xe giông như trong so sánh trước hoặc có 
thê là xe kế tiếp, với xe bây giờ là xe cuôi cùng trên đường đi 
Texas. Quá trình tiếp tục cho tới khi đạt đến bước thứ 4. 

Chú ý là đường đi Texas được dùng như một stack, việc dẫn 
đường ( routing ) một xe đi tới Texas là thao tác cất ( push ), việc 
quay một xe đã ở trên dường đi Texas và gửi tới Caliíornia là thao 
tác lấy ( pop ). 

Trật tự của các biến tương tự nhau trong công thức dạng infix 
và dạng Polish ngược nhưng trật tự của các toán tử lại khác nhau. 
Các toán tử xuất hiện trong Polish ngược theo trật tự thực sự chúng 
được thực thi trong thời gian đánh giá biểu thức. Hình 5.30 cho các 
thí dụ về công thức dạng infix và-các công thức tương đương dạng 
Polish ngược. 


Infíx Reverse Pollsh 


A + BxC 

ABC X + 

A X B + c 

AB X c + 

AxB+CxD 

AB X CO X + 

(A + BJ/(C-D) 

A X B/C 

AB + CD-/ 

ABxC/ 

«A + B)xC+ D)/(E + F + G) 

AB + CxD + EF + G+/ 


Hình 5.30 Các thí dụ về công thức dạng infix và tương đương ở dạng 

Polish ngược 
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Dánh giá công thức Polish ngược 

Giái thuật sau đây đánh giá một công thức Polish ngược 
GIẢI THUẬT 

1. Khảo sát từng ký hiệu trong công thức Polish ngược, bắt 
đầu ở cực trái cho tới khi gặp một toán tử 

2. Viết toán tử đó và 2 toán hạng ngay bên trái toán tử 
lên một tờ giây nháp 

3. Xóa toán tứ và các toán hạng khỏi công thức, tạo một 
khoảng trông 

4. Thực hiện phép toán trên các toán hạng và, viết kết quã 
vào khoảng trông đó 

5. Nếu bây giờ công thức có một giá trị, giá trị này là kết 
quả và giải thuật kết thúc ; ngược lại lặp lại bước 1 

Hình 5.31 mô tả việc đánh giá một công thức Polish ngược. Trật tự 
của các toán tử là trật tự thực sự chúng được đánh giá. 

Polish ngược là ký hiệu lý tưởng dể đánh giá một công thức trên 
máy tính sử dụng stack. Công thức đó bao gồm n ký hiệu, mỗi ký 
hiệu có thể là một biến hoặc một toán tử. Giải thuật để đánh giá 
công thức Polish ngược sử dụng stack là như sau. 

GIẢI THUẬT 

1. Thiết lập k bằng 1 

2. Khảo sát ký hiệu thứ k. Nếu ký hiệu là một biến, cất 
biến vào stack. Nếu ký hiệu là một toán tử, lây 2 phần 
tử ơ đỉnh ra khỏi stack, thực hiện phép toán và cất kết 
quả trở lại vào stack 

3. Nếu k - n, giải thuật kết thúc và kết quả ở trong stack, 
ngược lại, cộng 1 vào k và lặp lại bước 2 
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Hình 5.32 trình bày việc đánh giá công thức tương tự như trong 
hình 5.31 nhưng ớ đây sử dụng stack. Chữ sô' trên đỉnh stack là 
toán hạng bên phải, không phải toán hạng bên trái. Điều này quan 
trọng đối với phép trừ và chia vì thứ tự của các toán hạng rất có ý 
nghĩa ( không giông như phép cộng và nhân ). 


Infix tormula (8 + 2 X 5)/(1 +3x2-4) 
Reserve Polish íormula 8 2 5 X + 1 3 2 X + - / 


Step 

Formula to be 
evaluated 

Leftmost 

operator 

Left 

operand 

Rtgtit 

operand 

Result 

New íormula atter 
pertorming operation 

1 

825x + 1 32x + 4-/ 

X 

2 

5 

10 

8 1 0+1 32X+4-/ 

2 

810 + 132X + 4-/ 

+ 

8 

10 

18 

1 81 3 2 X + 4 - / 

3 

18132X + 4-/ 

X 

3 

2 

6 

1 81 6 + 4-/ 

4 

4 8 1 6 + 4-/ 

+ 

t 

6 

7 

1 8 7 4 -/ 

5 

1 874-/ 

- 

7 

4 

3 

183/ 

6 

1 83/ 

/ 

18 

3 

6 

6 


Hình 5.31 Đánh giá công thức ( 8 + 2 X 5 ) / ( 1 + 3 X 2-4) bằng cách 
biến đối thành dạng Polish ngược rồi đánh giá 

Iníix íbrmuỉa : công thức dạng infix 

Reverse Poloish íbrmula : công thức dạng Polish ngược 

Step : bước 

Formula to be evaluated : công thức được đánh giá 
Leftmost operator : toán tử cực trái 
Left, right operator : toán tử trái, phái 
Result : kết quả 

New íbrmuỉa after períorming operation : công thức mới sau khi thực hiện 
thao tác 

Máy tính tổ chức theo cách dùng stack có nhiều lợi điểm hơn so với 
máy dùng nhiều thanh ghi, như trong các thí dụ của chúng ta : 

1. Chiều dài các chỉ thị ngắn do bởi có nhiều chỉ thị không 
địa chi 


2. Dề,dàng đánh giá các công thức 
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Iníix tormula (8 + 2 X 5)/{t +3x2-4) 

Reverse Polish íormula 825x + 1 32x + 4- / 


step 


1 

825x + 1 32x + 4-/ 

Push 8 

2 

25x + 1 32x + 4-/ 

Push 2 

3 

5x + 1 32 X + 4 -/ 

Push 5 

4 

X + 1 32 X + 4-/ 

Multipty 2x5 

5 

+ 1 3 2 X + 4 -•/ 

Add 8 + 10 

6 

132X + 4-/ 

Push 1 

7 

32 X + 4 -/ 

Push 3 

8 

2x + 4-/ 

Push 2 

0 

X + 4-/ 

Multiply 3x2 

10 

+ 4-/ 

Add 1 + 6 

11 

4-/ 

Push 4 

12 

-/ 

Subtract 7 - 4 

13 

/ 

Dívlde 18/3 


(a) 



1 2 3 4 5 6 7 8 9 10 11 12 13 

(b) 


Hình 5.32 Sử dụng staek để đánh giá công thức Polish ngưựe (a) Các bước 
trong quá trình đánh gỉá (b) Stack tương ứng sau mồi bước (c) Mùi tên là 

con trỏ stack 
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Infix íbrmula ; công thức dạng infix 

Reverse Poloish formula : công thức dạng Polish ngược 

Push : cất 

Multiply : nhân 

Add : cộng 

Subtract : trừ 

Divide : chia 

3. Không cần dùng những thuật toán phức tạp đế tối ưu 
hóa thanh ghi 

Không có CPU nào của Intel có kiểu định địa chỉ stack nhưng 
chúng có những chỉ thị đặc biệt PƯSH và POP đế đặt các phần tử 
vào stack và lây chúng ra khỏi stack. Trái lại, tất cả các chip 680x0 
đều có kiểu định địa chỉ stack sử dụng phương pháp tự động đánh 
chỉ số. Trong kiểu giảm trước ( predecrement mode ), con trỏ stack 
( một thanh ghi ) được giảm trước và sau đó thanh ghi được sử dụng 
làm con trỏ. Trong kiểu tăng sau ( postincrement mode ), hành 
động gián tiếp được thực hiện và sau đó tăng thanh ghi. 

Nếu stack lớn dần từ địa chỉ cao tới địa chỉ thấp và con trỏ 
stack luôn luôn trỏ tới đỉnh của stack ( địa chỉ thấp nhất chứa một 
phần tử cùa stack ), kiểu giám trước được sử dụng để cất và kiểu 
tăng sau được sứ dụng để lấy ra. Nếu stack lớn dần từ địa chỉ thấp 
tới địa chỉ cao và theo quy ước con trô stack trỏ tới phần tử trống 
đầu tiên trên stack thay vì phần tử vừa cất sau cùng, kiểu tăng sau 
được dùng đế cât và kiểu giảm trước dược dùng để lấy. Sử dụng hệ 
thống nào chỉ là vấn đề sớ thích và quá trình sử dụng. 

5.3.7 Các thí dụ về định địa chỉ 

Các phần trước đã thảo luận về một sô kiểu định địa chí khác 
nhau : tức thời, trực tiêp, gián tiếp, định chỉ sô và v.v... Đến dây 
vẫn còn tồn tại vấn đề về cách thức phần cụíng hoặc trình phiên 
dịch cấp 1 nhận biêt một địa chỉ là tức thời, trực tiếp hay gián tiếp 
v.v... Một giải pháp là có một opcode riêng cho từng kiểu định địa 
chỉ, nghĩa là có các opcode riêng cho các chỉ thị cộng tức thời ( ADD 
IMMEDIATE ), cộng trực tiêp ( ADD DIRECT ), cộng gián tiếp 
( ADD INDIRECT ) và v.v... Một giải pháp khác tạo ra trường kiểu 
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trong địa chỉ là mỗi một chỉ thị chứa một vài bit trong địa chỉ để 
chỉ ra kiểu định địa chỉ. 

Trong phần này chúng ta sẽ thảo luận về cách thức nhận dạng 
các kiểu định địa chỉ qua 2 thí dụ. Tuy nhiên vì cả 2 thí dụ đều lớn, 
gây khó khăn và dề nhầm lẫn, trước tiên chúng ta sè mô tả cách 
định địa chỉ trên PDP-11 do đơn giản, dễ diễn đạt và rõ ràng. 

Định địa chỉ trên PDP-U 

Các địa chỉ trên PDP-11 được xác định bằng các trường 6-bit 
như trình bày trong hình 5.33(a). Các chỉ thị 1-địa chỉ có một 
trường như vậy và các chĩ thị 2-địa chỉ có 2 trường, các chỉ thị đưỢc 
mã hóa giông nhau. Mỗi trường 6-bit có 3 bit cho kiểu định địa chí 
và 3 bit cho số của thanh ghi. Ý nghĩa cúa các kiểu được cho trong 
hình 5.33(b). Trên PDP-11, thanh ghi số 6 là con trỏ stack và thanh 
ghi sô' 7 là bộ đếm chương trình. Bộ đếm chương trình tăng 2 ngay 
sau khi một từ chỉ thị được tìm nạp ( trước khi chỉ thị được thực 
thi ). Đặc tính này phải được ghi nhớ khi khảo sát các kiểu định 
địa chỉ. 

Tất cả các chỉ thị của PDP-11 thực tế chỉ có 16 bit, nhưng trong 
một sô' trường hợp có một hoặc hai từ phụ trực tiếp theo sau chỉ thị, 
được chỉ thị sử dụng và được xem như một phần của chỉ thị. Kiếu 
định địa chỉ thứ 6 và thứ 7 cần một hằng sô' 16-bit để định chỉ sô. 
Hơn nữa, nếu kiểu thứ 2 hoặc thứ 3 được xác định bằng thanh ghi 
•số 7 ( bộ đếm chương trình ), chuỗi các bước sau đây sẽ xảy ra. 

Trước tiên, chỉ thị được tìm nạp và thanh ghi sô 7 được tăng 
lên 2 ( 1 từ có 2 byte ). Lúc đó thanh ghi sô' 7 được dùng như một 
con trỏ trỏ tới dữ liệu ( kiểu 2 ) hoặc địa chỉ của dừ liệu ( kiểu 3 ). 
Trong cả 2 trường hợp, từ được R7 trỏ tới là từ theo sau chỉ thị. Sau 
khi tìm nạp từ này, thanh ghi sô' 7 được tự động tăng bới 2. Việc 
định địa chỉ tự động tăng xác định rõ bộ đếm chương trình là một 
kỹ xảo thông minh cho phép từ theo sau chỉ thị được sử dụng như là 
dữ liệu. Trong kiểu 2 từ này là toán hạngvà đây là kiểu định địa 
chỉ trực tiếp. Nếu cả 2 nguồn và đích đều cần thêm một từ phụ, từ 
đầu tiên dành cho nguồn. 
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■* -16-bitword-► 

Source Destlnation 

Address ---—--" 


OPCODE 

SOURCE 

SOURCE 

DESTINATION 

DESTINATION 

MODE 

REGISTER 

MODE 

REGISTER 

4 

3 

3 

3 

3 


N+2 


N+4 


(Next word 1) 

ĩẽ 


(Next word 1) 
16 


(a) 


Mode 

Name 

How the operand is located 

0 

Resgister 

addressing 

The operand Is in R. 

1 

Resgister 

indĩrect 

R contains a pointer to the operand. 

2 

Autoincrement 

The content of R is letched and used as a pointer to 
the operand. After thỉs step, but betore the instruction 
is executed, R is incremented by 1 (byte instructions) or 

2 (word instruction). 

3 

Autoĩncrement 

indirect 

The address of a memory word containing a pointer to the 
operand is letched trom R. Then R is incrimẻnted by 1 or 

2 belore the instruction is executed. 

4 

Autodecrement 

R is lỉrst decremented by 1 or 2. The new value of R is 
then used as a pointer tó the operand. 

5 

Aulodecrement 

ìndirect 

R is tirst decremented by 1 or 2. The new value of R Is 
then used as the address of a memory location containing 
a pointer to the operand. 

6 

Indexing 

The operand is at the address equal to the sum of R (the 
index register) and the 16 bit 2’s conplement otlset in the 
next word. In modes 6 and 7, the program counter (R 7) is 
incremented by 2 immediately aftèr the next word is íetched. 

7 

Indexing + 

indireet 

addressing 

The memory locatlon containing a pointer to the operand is 
tound by adding the contents 01 R and the next word. In 
modes 6 and 7, the program counter (R7) is incremented by 

2 immediately alter the next word is lètched. 


<b> 


Hình 5.33 (a) Khuôn dạng chỉ thị 2 địa chỉ cùa PDP-11 (b) Mô tả các 
kiêu định vị địa chí. R là thanh ghi dược xác dịnh cùng với kiểu 
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16-bit word : từ 16-bit 

Address : địa chỉ 

Source : nguồn 

Destination : đích 

Source mode : kiểu nguồn 

Destination mode : kiếu đích 

Source register : thanh ghi nguồn 

Destination register : thanh ghi đích 

Next word : từ kế 


Kiểu 

Tên 

Cách toán hạng được định vị 

0 

Định địa chỉ 
thanh,ghi 

Toán hạng ờ trong R 

1 

Gián tiếp 
thanh ghi 

R chứa con trỏ trò đến toán hạng 

2 

Tự động tăng 

Nội dung cua R được tìm nạp và sứ dụng như một 
con trỏ trò tới toán hạng. Sau bước này, nhưng 
trước khi chi thị được thực thi, R được tăng 1 
( các chi thị bytc ) hoặc 2 ( các chỉ thị từ ) 

3 

Gián tiếp 
tự động tăng 

Địa chi cùa một từ nhớ chứa con trò trỏ tới toán 
hạng được tìm nạp từ R. Sau dó R được tảng 1 
hoặc 2 trước khi chỉ thị được thực thi 

4 

Tự động gíãm 

R trước tiên được giảm 1 hoặc 2. Giá trị mới của 

R được dùng như 1 con trỏ trỏ tới toán hạng 

5 

Gián tiếp 
tự động giảm 

R trước tiên dược giảm 1 hoặc 2. Giá trị mới ciia 

R dược dùng như địa chỉ của một vị trí nhớ chứa 
con tró trò tới toán hạng 

6 

Định chỉ số 

Toán hạng ở địa chi là tổng cũa R ( thanh ghi chỉ 
sô ) với độ dời bù 2 16-bit trong từ kế. Ớ các kiều 

6 và 7, bộ đếm chương trình R7 được tăng 2 ngay 
sau khi từ mới được tìm nạp 

7 

Định địa chỉ 
gián tiếp + 
định chỉ số 

VỊ trí bộ nhớ chứa 1 con trỏ trò tới toán hạng 
được tìm thấy bằng cách cộng nội dung cua R với 
từ kế. Trong các kiểu 6 và 7, bộ đêm chương 
trình R7 được tăng 2 ngay sau khi từ kế được tim 
nạp 
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m 


PDP-ll có một dạng định địa chỉ đáng chú ý gọi là định địa chỉ 
tự tương đối ( self-relative ) hoặc định đ Ịa chỉ độc lập với vị trí 
{ position-independent ). Khi kiểu 6 và thanh ghi số 7 được xác 
định, địa chỉ của toán hạng được tìm thây bằng cách thiết lập tổng 
của từ chỉ sô' { index word ) theo sau chỉ thị với bộ đếm chương 
trình. Thực tế, từ chỉ sỏ cho địa chỉ của toán hạng bằng cách chỉ rõ 
từ chỉ số cách chỉ thị bao xa, về phía trước hoặc về phía sau. Nói 
cách khác, từ chỉ sô" là một khoảng cách tương đôi. 

Nếu tất cả tham chiếu bộ nhớ đều sử dụng dạng định địa chỉ 
này thay vì định địa chỉ trực tiếp ( kiểu 3 với thanh ghi số 7 ), có 
thể nạp chương trình vào một nơi bất kỳ trong bộ nhớ và chương 
trình sẽ chạy đúng. Ngoài ra, chương trình còn có thể di chuyển sau 
khi được nạp do bởi mặc dù các địa chỉ tuyệt đôi của các toán hạng 
thay đổi, khoảng cách của chúng từ các chỉ thị tham chiếu chúng 
vần cố định. Tuy nhiên, nếu có một địa chỉ trở về từ chỉ thị gọi thủ 
tục ở trong stack, ta không thể di chuyển chương trình do các địa 
chỉ này là tuyệt đối. 

Ta xét chỉ thị MOV trong hình 5.34(b) như là một thí dụ về khả 
năng của cơ chế định địa chỉ trong PDP-11. Lệnh này di chuyển 
toán hạng nguồn đến thanh ghi sô' 4. Hình 5.34(b) trình bày tâ't cả 
các biến thể khác nhau cũa chỉ thị này đô'i với các kiểu nguồn và 
các thanh ghi khác nhau. 

Do cả kiểu định địa chỉ nguồn và định địa chỉ đích đều có thể 
được xác định độc lập, một opcode có thể sinh ra một lượng lớn chỉ 
thị khác nhau. Thí dụ chỉ thị ADD có thể sử dụng để : 

Cộng một thanh ghi với một thanh ghi khác ( 0,0 ) 

Cộng một thanh ghi với một từ nhớ ( 0,6 ) 

Cộng một từ nhớ với một thanh ghi ( 6,0 ) 

Cộng một từ nhớ với một từ nhớ khác ( 6,6 ) 

Lấy một từ ra khỏi stack và cộng với một thanh ghi ( 2,0 ) 

Lấy một từ ra khỏi stack và cộng với một từ nhớ ( 2,6 ) 

Cộng một toán hạng tức thời với một thanh ghi ( 2,0 ) 
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Cộng một toán hạng tức thời với một từ nhớ ( 2,6 ) 

Cộng một toán hạng tức thời với từ trên đỉnh stack ( 2,1 ) 

Cộng một thanh ghi với từ trên đỉnh stack ( 0,1 ) 

Cộng một từ nhớ với từ trên đỉnh stack ( 6,1 ) 

Cộng một từ nhớ với một địa chỉ xác định gián tiếp ( 6,7 ) 

Cộng một thanh ghi với một địa chỉ xác định gián tiếp ( 0,7 ) 

Cộng một toán hạng tức thời với địa chỉ xác định gián tiếp (2,7) 

Cũng còn nhiều khả năng khác nữa. Các sôf trong dấu ngoặc ở danh 
sách trên là các kiểu nguồn và đích. Lưu ý rằng kiểu 6 với thanh 
ghi R7 luôn luôn có thế được thay bằng kiểu 3 với R7 ( nghĩa là bộ 
nhớ có thể được định địa chỉ tự tương dối hoặc trực tiêp ). Cũng lưu 
ý rằng, kiểu 1 với thanh ghi sô 6 sử dụng từ trên đỉnh của stack 
như là nguồn hoặc đích nhưng không loại được từ này ra khỏi stack, 
trong khi kiểu 2 với thanh ghi sô 6 thực hiện được điều này. 

Mặc dù chỉ sử dụng một opcode, chỉ thị ADD của PDP-11 có 
hàng chục biến thể phân biệt và hữu dụng. Nêu tất cả những biên 
thể của 12 chỉ thị 2 địa chỉ được xem như là những chỉ thị riêng rẽ, 
PDP-11 có hàng trăm lệnh. Do tính rất linh hoạt của các kiểu định 
địa chỉ, PDP-11 có một tập chỉ thị mạnh với chỉ vài opcode được sử 
dụng 

Định địa chỉ trên 8088/80286/80386 

Các kiểu định địa chỉ trên 8088 và 80286 ( và 80386 trong các 
segment 16-bit ) đều giông nhau. Chúng cũng vụng về và khá bât 
thường. Byte MODE trong hình 5.22 điều khiển các kiểu định địa 
chỉ. Một trong các toán hạng được xác định bởi sự kêt hợp cũa 
trường MOD và trường R/M. Toán hạng kia luôn luôn là thanh ghi 
được xác định bởi trường REG. 

32 tố hợp có thể được xác định bởi trường MOD 2-bit và trường 
R/M 3-bit, trình bày trong bảng của hình 5.35. Thí dụ nếu cả 2 
trường là zero, tổng của BX và SI chỉ cho ta toán hạng bằng cách 
dùng kết quả này làm con trỏ trong bộ nhớ để định vị toán hạng 
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^-16-blt worđ-► 

Source Destlnation- 

Address * -~-V-^-« 


MOV 

SOURCE 

MOÒE 

M 

SOURCE 

RẼG 

R 

0 

4 

4 

3 

3 

3 

3 


(Next word) 1 

K 



Source (a) 

mode 

M fi = 0 - 5 H = 6 R =7 


0 

Move R to R4 
(reglster - register) 

Example: MOV R3, R4 

Move stack potnter to R4 

Example: MOV SP. R4 

Move program counter to R4 
Example: MOV PS, R4 

1 

Move memory word polnted 
to by R to R4 

Example: MOV *R3, R4 

Move top of the stack to R4, 
but do not remove It from 
the stack 

Example: MOV *SP, R4 

Move K to R4; program 
counter Is not Incremented 
again so K will be executed 
as the next Instructlon 

Eample: MOV *PC, R4 

2 

Move memory word polnted to 
by R to R4 and add 2 to R 

Example: MOVR3+,R4 

Remove a work Iran the stack 
and put tt tn R4 (pop 

Instrúction) 

Example: MOV <SP)+, R4 

Move K to R4 (immedlate) 
addiesstng 

Example: MOV $24, R4 

3 

Move to R4 the memory word 
address by the vvord R points 
to, and add 2 to R 

Example: MOV *R3+, R4 

Pop the address of the source 
operand from the stack, and 
move the source operand ít self 
to R4 

Example: MOV *(SP)+, R4 

Load R4 trom memory address K 
(dierect addressing) 

Example: MOV *$24 t R4 

4 

Decrement R by 2 and then (oad 
R4 from the address R points to 

Example: MOV - (R3), R4 

M = 4 and R = 5 Is noi usetul as 
a source; hovvever tt Is used as 
a destlnatton in push Instructtons 
Example of push: MOV $6, • (SP) 

Not used 

(causes an inAnlte loop) 

5 

Decrement R by 2 and then load 
R4 indirectty fróm the address 

R polnts to 

Example: MOV *- (R3), R4 

Nữt used 

Not used 

(causes an InAnlte loop) 

6 

Load R4 wHh the memory word 
at C(R) + K (Indexlng) 

Example: MOV 24 (R3), R4 

Load R4 with the work K/2 words 
below the top of the stack 

Example: MOV 24 (SP), R4 

Load R4 wtth the word K/2 
words from thls tnstmction 
(salt relative addreeelng) 
Exampíe: MOV X, R4 

Note: The assembter computes 
the appoprỉate constant to 
addrẽss X 

7 

Load R4 wlth the memory word 
polnted to bỵ C(R) + K 
(indexlng + indìréct addresslng) 

Example: MOV «24 (R3), R4 

Load R4 from the work whose 
address le K/2 words betow 
the top ot the stack 

Example: MOV *24 (SP), R4 

Load R4 with the word pointed 
to bv the word K bytes trom 
thls ìs Instructton (índirect 
addressing) 

Exanĩpte: MOV *x, R4 

Note: The assembter computes 
the approriate constant to 
addréss X 


<b) 


Hình 5.34 (a) Chi thị di chuyên một từ tói thanh ghi R4 cùa PDP-11 (b) 
Những biến thể khác nhau đối với kiểu nguồn và các thanh ghi khác nhau. 
R là thanh ghi và C(R) là nội dung cúa thanh ghi. Dấu $ cho biết một toán 
hạng tức thời và dấu * cho biết hành động gián tiếp ( ký hiệu của trình 

dịch hợp ngữ trong UNIX ). 
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KI 


Source : nguồn 
Destination : đích 
MOV : chỉ thị di chuyển 
Source mode M : kiểu nguồn M 
Source reg R : thanh ghi nguồn R 
Next word : từ kê 


Kiều 

Nguồn 

M 

R = 0 - 5 

R = 6 

R - 7 

0 

Di chuyển R tới R4 
( thanh ghi - thanh 
ghi ) 

TD : MOV R3, R4 

Di chuyến con trỏ 
stack tới R4 

TD : MOV SP, R4 

Di chuyên bộ đếm 
chương trình tới R4 
TD : MOV PC, R4 

1 

Di chuyên từ nhớ 
được trò bỡi R tới 
R4 

TD : MOV *R3, R4 

Di chuyến đỉnh của 
stack tới R4 nhưng 
không loại bó khỏi 
stack 

TD : MOV *SP, R4 

Di chuyên K tới R4, 
bộ đếm chương 

trình không được 
tăng lần nữa do K 
sẽ được thực thi 
như là chỉ thị kế 

TD : MOV *PC, R4 

2 

Di chuyến từ nhớ 
được trỏ bới R tới 
R4 và cộng R với 2 
TD : MOV (R3)+, 
R4 

Loại bò 1 từ khỏi 
stack và đặt từ này 
vào R4 ( chỉ thị pop 
) 

TD : MOV (SP)+, 
R4 

Di chuyến K ới R4 ( 
định địa chỉ tức 
thời ) 

TD : MOV $24, R4 

3 

Di chuyền tới R4 từ 
nhớ được địa chỉ 
hóa bởi từ R trò tới 
và cộng R với 2 

TD : MOV *(R3)+, 
R4 

Lấy địa chỉ của 
toán hạng nguồn từ 
stack và tự di 
chuyến toán hạng 
nguồn tới R4 

TD : MOV *(SP)+, 
R4 

Nạp R4 từ địa chỉ K 
cua bộ nhớ ( định 
địa chi trực tiếp ) 

TD ; MOV *$24, R4 

4 

Giám R bới 2 và 
sau đó nạp R4 từ 
địa chỉ R trỏ tới 

TD : MOV -(R3>, 
R4 

M = 4 và R = 6 
không thường dùng 
làm nguồn mà dùng 
làm đích trong các 
chỉ thị push. 

TD : MOV $6, -SP 

Không đùng 
( gây nên một vòng 
lặp vô tận ) 
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5 

Giám R bơi 2 và 
sau đó nạp R4 gián 
tiếp từ địa chỉ R trỏ 
tới 

TD : MOV *-(R3), 
R4 

Không dùng 

Không dùng 
( gãy nên một vòng 
lặp vô tận ) 

6 

Nạp R4 từ nhớ ở 
C(R) + K ( định chỉ 
số ) 

TD : MOV 24(R3), 
R4 

Nạp R4 từ nhớ ỡ 
phía dưới stack K/2 
từ 

TD : MOV 24(SP), 
R4 

Nạp R4 từ nhớ ở 
phía cách chỉ thị 
này K/2 từ ( tự định 
địa chỉ tương đối ) 

TD : MOV X, R4 

Lưu ý : Trình biên 
dịch hợp ngữ tính 
hằng số cho X 

7 

Nạp R4 từ nhớ được 
trò bời C(R) + K 
( định chỉ số + định 
địa chì gián tiếp ) 

TD : MOV *24(R3), 
R4 

Nạp R4 từ có địa 
chi cách đinh của 

stack K/2 từ 

TD : MOV *24(SP), 
R4 

Nạp R4 từ được trỏ 
bởi từ cách chỉ thị 
này K byte ( định 
địa chí gián tiếp ) 

TD : MOV *x, R4 

Lưu ý : Trình biên 
dịch hợp ngữ tính 
hằng số cho X 


R/M 


MOD 



00 

01 

10 

11 

000 

M[BX + SI] 

M[BX + SI + DISP8] 

M[BX + SI + DISP16] 

AXorAL 

001 

M[BX + Dị) 

M[BX + DI + DISP8} 

M[BX + DI + DISP16] 

cx or CL 

010 

M[BP + SI] 

M[BP + SI + DISP8] 

MỊBP + SI + DISP16] 

DX or DL 

011 

M[BP + DI] 

M[BP + DI + DISP8] 

M[BP + DI + DISP16] 

BX or BL 

100 

M[SI] 

M[SI + DISP0] 

M[SI + DISP16] 

SPorAH 

101 

M[DI] 

M[DI + DISP8] 

MỊDI + DISP16} 

BP or CH 

110 

Direct addresslng 

M[PI + DISP8] 

M[BP + DISP16Ị 

SI or CH 

111 

M[BX] 

M[BX + 0ISP8Ị 

M[BX + DISP16Ị 

DI or DH 


Notatlọn: ts a memory reterence 

DỊSP8 Isan S-btt dlspiacement 
OISP 16 Is an 16-blt dlsplacement 


Hình 5.35 Các kiểu định địa chỉ của 8088 và 80286 
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Notation :[...] is a memory reference : Ký hiệu :[...] là một tham 
chiếu bộ nhớ 

DISP8 is an 8-bit displacement : DISP8 là một độ dời 8-bit 
DISP16 is an 16-bit displacement : DISP16 là một độ dời 16 bit 

( byte hoặc từ ). Việc chọn byte hoặc từ được điều khiển bởi bit thãp 
của opcode (xem hình 5.22). 

Như trình bày khá rõ trong hình 5.35, có thể định địa chì gián 
tiếp qua thanh ghi BX, SI và DI nhưng không qua các thanh ghi 
AX, cx, DX, BP hoặc SP, cho phép địa chỉ trực tiếp nhưng chi với 
tư cách loại bỏ địa chỉ gián tiếp qua BP. Có thế sử dụng tổng cúa 
BX và DI làm con trỏ nhưng không được dùng tổng của BX và cx 
hoặc AX và DI. Không có các kiểu tức thời mặc dù có những opcode 
đặc biệt cho phép một sô chi thị được phép định địa chỉ tức thời. Tự 
động định chi sô cũng không được phép. 

2 cột giừa bao gồm các kiêu trong đó 1 hoặc 2 thanh ghi được 
cộng với một hằng sô* 8-bit hoặc 16-bit, hằng số này được gọi là độ 
dịch chuyển ( displacement ) theo sau chỉ thị. Nêu chọn một hằng 8- 
bit, hằng sô" được mở rộng dấu thành 16 bit trước khi cộng. Thí dụ 
chi thị ADD với R/M = 011, MOD = 01 và độ dịch chuyến là 6 tính 
tổng của BP, DI và 6, kết quả này được sứ dụng làm địa chí bộ nhớ 
của một trong các toán hạng. Trường REG xác định thanh ghi dùng 
làm toán hạng thứ 2. Bit 1 trong byte opcode cho biêt toán hạng 
nào là nguồn và toán hạng nào là đích. 

Cột MOD 11 có nghĩa là toán hạng ỏ trong thanh ghi được chí 
định, tùy thuộc vào toán hạng là toán hạng từ ( word operand ) hay 
toán hạng byte ( byte operand ). Dùng giá trị MOD này khi cá 2 
toán hạng đều ớ trong các thanh ghi. 

Vào lúc 80386 đã được dùng phổ biến, Intel nhận ra sai sót của 
phương pháp thiết kế. Mặc dù các kiểu trong các segmerỉt 16-bit là 
các kiểu đã cho trong hình 5.35, trong các segment 32-bit, một sơ đồ 
mới trong hình 5.36 được giới thiệu. Các kiểu mới có quy luật hơn 
các kiểu cũ và cho phép định địa chỉ gián tiếp qua nhiều thanh ghi. 
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MOO 



00 

01 

10 

11 

000 

M[EAX] 

M(EAX + DISP8] 

M{EAX + DISP32] 

EAXor AL 

001 

M[ECX] 

M[ECX + DISP8] 

M[ECX + DISP32] 

ECXorCL 

010 

M[EDX] 

M[EDX + DISP8] 

M[EDX + DISP32] 

EOX or DL 

011 

R/M 

100 

M[EBX] 

M[EBX + DISP8] 

M[EBX + DISP321 

EBXorBL 

SIB 

SIB wlth OISPS 

SIB with DISP32 

ESPorAH 

101 

Đirect addresalng 

M[EBP + DISP8] 

M[EBP + DISP32) 

EBP or CH 

110 

M[ESI] 

M[ESI + DISP8] 

M[ESI + DISP32] 

ESI or DH 

111 

MỊEDIỊ 

M[EDi + DISP8] 

M[EDI + DISP32Ỉ 

EDI or BH 


Notatịon: Is a mẹmory reference 

DISP8 Is an B-blt displacement 
DỊSP 16 ls an 16-brt dlsplacement 
SIB means Scale, Index, Base byte follows 


Hình 5.36 Các kiểu định dịa chỉ của 80386 

Notation :[...] is a memory reference : Ký hiệu :[...] là một tham 
chiếu bộ nhớ 

DISP8 is an 8-bit displacement : DISP8 là một độ dời 8-bit 
DISP32 is an 16-bit đisplacement : DISP16 là một độ đời 16 bit 
SIB means Scale, Index, Base byte follows : SIB có ngĩa là byte tì lệ, chỉ số, 
nền theo sau 

Hơn nừa, trong một số’ kiểu còn có thêm một byte gọi là SIB 
( scale, index, base ) theo sau byte MODE ( xem hình 5.22 ). 

Byte SIB xác định một hệ sô" tỉ lệ ( scale íactor ) và 2 thanh ghi. 
Khi có mặt byte SIB, địa chí của toán hạng được tính bằng cách 
nhản thanh ghi chỉ số với 1 , 2, 4, hoặc 8 ( tùy thuộc vào SCALE ), 
sau đó cộng với thanh ghi nền ( base register ) và cuối cùng có thể 
cộng thêm một độ dịch chuyển 8-bit hoặc 32-bit, tùy thuộc vào 
MOD. Hầu như tất cả các thanh ghi đều có thé sử dụng làm thanh 
ghi chi số hoặc thanh ghi nền, sơ đồ này tổng quát hơn so với sơ đồ 
của 8088. 

Các kiểu SIB có ích trong việc truy xuất các phần tử dãy. Thí dụ 
xét một phát biểu của Pascal : 
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for ỉ := 0 to n do a[ỉj := 0; 

trong đó a là một dãy các sô' nguyên 4-byte bên trong í cục bộ ) thù 
tục hiện hành. EBP được dùng để trỏ tới nền của khung stack chứa 
các biến và các dãy cục bộ, như trình bày trong hình 5.37. Trình 
biên dịch cho phép theo dõi i trong EAX. Đế truy xuất a[ỉ| nên 
dùng một kiêu SIB, kiểu này dùng tổng của 4 X EAX, EBP và 8 làm 
địa chỉ toán hạng để lưu vào a[iì trong một chỉ thị. Trên 8088, trước 
tiên ỉ được sao chép vào một thanh ghi nháp, dịch trái 2 bit, cộng 
với BP và cuôi cùng được định chỉ số, cho tổng cộng 4 chỉ thị thay 
vì một. 



EBP 


EBP + 8 
EBP + 12 
EBP + 16 


/ In EAX 

SIB Mode reterences 
M[4 + EAX + EBP +8] 


Hình 5.37 Trụy xuất tới a[/'l 


Stack frame : khung stack 

Other local variables : các biến cục bộ khác 

SIB mode reíerences : các tham chiêu kiéu SIB 


Định địa chỉ trên 68000/68020/68030 

Các kiểu định địa chỉ cúa 68000 tương tự với các kiêu định địa 
chỉ của PDP-11. Chúng được tóm tắt trong hình 5.38. Cả 2 CPU đều 
xác định toán hạng bằng một trường 6-bit bao gồm 3 bit cho kiểu 
và 3 bit cho thanh ghi. Bộ đêm chương trình cùa 68000 không phái 
là thanh ghi tổng quát, vì thế kỹ xảo dùng trên PDP-11 đế nhận 
được địa chỉ tức thời và địa chỉ trực tiếp bằng cách tăng tự động bộ 
đếm chương trình không áp dụng được. Thay vào đó, các kiêu định 
địa chỉ rõ ràng được cung cấp. Con trỏ stack được địa chỉ hóa ( như 
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R7 ), vì thế tất cả các kiểu định địa chỉ stack đều áp dụng được cho 
68000. 

Mặc dù Motorola đã thực hiện công việc với các kiểu định địa 
chì trên những chip ban đầu tốt hơn Intel, họ vẫn không thỏa mãn 
với những thành công trên 68020. Họ muôn có một phương pháp 
truy xuất các phần tử dãy chỉ bằng một lệnh, cũng như một phương 
pháp đế truy xuât những loại câu trúc dữ liệu khác. Điều mong 
muốn này dã dẫn tới nhiều kiểu định địa chi mới phức tạp. Các 
kiểu này không bị thay đối trong 68030. 


Kiêu 

Thanh 

Ghi 

Các 

từ 

phụ 

Mô tả 

* 

0 

D 

0 

Toán hạng trong thanh ghi D 

1 

A 

0 

Toán hạng trong thanh ghi A 

2 

A 

0 

Con trò tới toán hạng trong thanh ghi A 

3 

A 

0 

Con trỏ trong A, tự động tăng A sau 

4 

A 

0 

Tự động giảm A, rồi dùng như con trỏ 

5 

A 

1 

Kiểu định chỉ sô' với độ dịch 16-bit 

6 

A 

1 

A + chỉ số + dô dich 8-bit = đia chỉ 

* * * 

7 

0 

1 

Định địa chỉ trực tiếp với địa chỉ 16-bit 

7 

1 

2 

Định địa chỉ trực tiếp với địa chỉ 32-bit 

r-> 

i 

2 

1 

Địa chỉ toán hạng = PC + độ dịch 16-bit 

7 

3 

1 

Đ/c toán hạng = PC+chỉ sÔH-độ dịch 8-bit 

7 

4 

1 hoặc 2 

Dữ liệu tức thời 


Hình 5.38 Các kiêu định địa chỉ trên 68000 


Vấn đề chính là cách thức má hóa chúng vì tất cả 8 kiểu đã 
được sử dụng. Vấn đề được giải quyết bằng cách dùng kiểu 6 cũng 
như kiểu 7 với thanh ghi sô 3. 2 trong các kiểu này đều có một từ 
phụ 16-bit theo sau từ chỉ thị, như trình bày trong hình 5.39(a)-(b). 
2 bits chưa sử dụng trước tiên được đổi thành một hệ số tỉ lệ ( 1, 2, 
4 hoặc 8 giông như 80386 ) trong dạng 1-từ ( one-word format), như 
trình bày trong hình 5.39(c). 
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Blts 

13 

3 

3 

(a) 


OPCODE 

MODE 

REG 


(b) 


D/A 

REG 

W/L 

00 

0 

DISPLACEMENT 


(e) 


«J) 


D/A 

REG 

W/L 

SCALE 

0 

DISPLACEMENT 


D/A 

REG 

W/L 

SCALE 

1 

BS 

IS 

BD SIZE 

0 

l/IS 

BASE DISPLACEMENT (0,1, or 2 words) 


OUTER DISPLACEMENT (0,1, 

or 2 words) 




Notation for (b)-(d) 


D/A 0= Select a D reglster, 1 = select an A register 

REG Index or regĩster number 

W/L 0= Word, 1 = Long 

SCALE 0,1, 2,4 mean scăle tactors of 1,2,4,8 

BS Base reglster suppress 

IS Index reglster súppress 

BD SIZE Base dlsplacement size (unused, 0-2 words) 

l/IS Index/lndlrect selection 


Hình 5.39 (a) Chỉ thị 1 toán hạng của 680x0 (b) Từ mỡ rộng trên 68000 
(c) Từ mở rộng dạng tóm tắt trên 68020 và 68030 (d) Các từ mờ rộng 

dạng đầy đú trên 68020 và 68030 

Ký hiệu cho (b) - (d) ; 

D/A 0 = chọn thanh ghi D, 1 = chọn thanh ghi A 

REG số của chi sô* hoặc thanh ghi 

SCALE 0, 1, 2, 4 nghĩa là các hệ số tỉ lệ là 1, 2, 4, 8 

W/L 0 = từ, 1 = từ dài 

BS cấm thanh ghi nền 

IS cấm thanh ghi chỉ số 

BD SIZE kích thước độ dịch chuyển nền ( không dùng, 0-2 từ ) 

I / IS chọn chí số / gián tiếp 

Để điều tiết các kiểu định địa chỉ mới, một khuôn dạng mới 
được đưa ra, được xác định bằng cách có bit 8 được thiếp lập là 1 
thay vì là 0. Ở khuôn dạng này, trường DISPLACEMENT 8-bit 
được thay bằng 4 trường mới và 2 độ dịch chuyển mới tùy chọn. Do 
không có ý định đi sâu vào tất cả chi tiết của khuôn dạng này, nên 
ta chỉ cần biết rằng có nhiều kết hợp của các thanh ghi thêm vào 
( scaled ) và các độ dịch chuyển, bao gồm các kiểu SIB của Intel và 
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các kiểu khác. Một sô kiểu có sự tính toán nhiều pha ( phase ), 
trước tiên cộng các thành phần khác nhau, đi tới bộ nhớ để tìm nạp 
con tró và sau đó tiếp tục tính địa chỉ trên con trỏ dã tìm nạp. 
Những kiểu này thỉnh thoảng có ích trong việc truy xuất các cấu 
trúc dữ liệu phức tạp thông qua các thú tục như là các thông sô' 
tham chiếu. 


Nếu nghĩ rằng : “ Sự phức tạp này có thực sự cần thiết 
không ? ” , chắc chắn sẽ có nhiều người cũng nghĩ như vậy. Nhiều 
nhà khoa học máy tính đã xem các kiểu định vị địa chỉ như trong 
hình 5.39(d) hơi giống với các kiêu miệng máng xỏ'i trong nhà thờ 
lớn Gothic- một phương pháp quá to để thực hiện điều đơn giản 
( về cơ bán, miệng máng xối là một ông dẫn dùng để trang trí ). 
Các nhà khoa học đã tranh cái kiên quyết cho các máy tính đơn 
giản nhưng có tốc độ xứ lý nhanh, gọi là máy RISK. 


Những máy này được thiết kế với đặc tính giảm đến mức tôi 
thiêu sự phức tạp và chạy rất nhanh. Chúng có rất ít kiểu định địa 
chí và các kiểu này đơn giản ở mức có thể có. Chúng ta sẽ nghiên 
cứu các máy này trong chương 8, như đá nói trước đây. 

5.3.8 Thảo luận vể các kiểu định địa chỉ 


Thực tê không phải tất cả các kiểu định địa chỉ mà chúng ta đă 
thảo luận đều quan trọng như nhau. Các trình biên dịch cho ngôn 
ngữ câp cao thường sứ dụng các kiểu sau : 


Tự động định chì số 

Trực tiếp 

Tức thời 

Chỉ số 

Thanh ghi 

Gián tiếp thanh ghi 


- Cât và lấy các tham sô' của thủ tục 
• Truy xuất các biến toàn cục 

- Dời chuyển các hằng sô 

- Truy xuâ't các biến cục bộ 

- Lưu giữ các biến cục bộ 

- Lưu giữ các con trỏ trỏ tới cấu trúc 


Một số kiểu định dịa chỉ khác cũng dược sử dụng nhưng không 
thường xuyên 
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Chúng ta hãy xét 3 thí dụ ( bao gồm cả PDP-11 ) đề xem các 
thức chúng làm việc. PDP-11 chỉ có 8 kiểu định địa chỉ nhưng bao 
gồm tất cá các kiểu quan trọng đã nêu ở trên. Các kiểu còn lại của 
PDP-11 thường hiện diện như là kết quả của tính đổi xứng < bít 
thấp của vùng địa chỉ có nghĩa là gián tiếp, vì thế các kiểu 1, 3, 5 
và 7 giông các kiểu 0, 2, 4 và 6 nhưng với một hành động gián tiếp 
phụ ). Sơ đồ này đơn giản, dễ hiểu, không khó hiện thực bằng vi 
mã và điều khiển tốt tất cả các trường hợp thông thường. Máy 
DEC nhận được một A+. 

Các nhà thiết kế chip 68000 đã sao chép các kiểu định địa chi 
của PDP-11 nhưng lại gặp một vấn đề là họ có 16 thanh ghi thay vì 
8. Với 16 thanh ghi họ phải cần 4 bit đề địa chi hóa chúng. Chì với 
6 bit cho trường kiểu và trường thanh ghi trong đó trường thanh 
ghi chiếm 4 bit, chỉ còn 2 bit cho trường kiểu nén các khả năng 
định địa chỉ bị kém đi. ( tuy nhiên phương pháp này có thể thực 
hiện, một bộ vi xử lý cữ của Texas Instrument, TI9900, đã thực 
hiện được điều này ). 

Giải pháp họ chọn là dùng một kiêu để định địa chi các thanh 
ghi D và đa số các kiểu khác chỉ làm việc với các thanh ghi A. 
Giống như PDP-11, 68000 cũng có các kiểu định địa chỉ bộ nhớ liên 
quan đến bộ đếm chương trình, nhưng không giống PDP-11, bộ đếm 
chương trình không phải là một trong các thanh ghi đa năng tống 
quát. Hầu hết các kiêu định địa chí quan trọng đều có mặt và sơ đồ 
định địa chỉ trực giao một cách hợp lý với các opcode. Có đầy đú 2 
kiểu định địa chỉ cho mỗi chỉ thị ( xem hình 5.21 ) nhưng nhu cầu 
xác định chiều dài ( 8, 16 hoặc 32 bit ) trong hầu hêt các chi thị lại 
bị loại bỏ. Nhìn chung 68000 không phải là một chip dỡ. Motorola 
nhận được điểm A-. 

68020 và 68030 có nhiều kiêu định địa chi phức tạp đế quản lý 
các dãy, các tham sô và các cáu trúc dữ liệu phức tạp. Nhừng kiếu 
này có hiệu suất cái tiên hơn 68000 một chút, nhưng cũng dần đên 
các trình biên dịch và vi mã phức tạp hơn. Người ta vẩn đưa ra câu 
hỏi là liệu việc tạo ra các kiểu định địa chi phức tạp hơn ( và các 
cấu trúc nói chung ) có là ý tướng tốt hay không. Một lần nữa, ta 
hây xem thảo luận về máy RISK trong chương 8. 
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Các kiểu định địa chỉ của 8088 và 80286 yếu hơn. Chúng chỉ có 
2 bit cho kiểu ( trên PDP-1 và 680x0 có 3 bit cho kiểu ). Tất cả 8 
thanh ghi của người sử dụng đều khác nhau. Chỉ có 3 thanh ghi 
được phép sử dụng cho địa chỉ gián tiếp ( SI, DI, và BX ) và chỉ có 4 
thanh ghi cho phép định chỉ sỏ ( SI, DI, BX và BP ). Không có kiểu 
định địa chỉ tức thời và chỉ số tự động mặc dù có một số chỉ thị đặc 
biệt có các toán hạng tức thời. Cách duy nhất để truy xuất stack là 
dùng các chỉ thị PƯSH và POP và chỉ PUSH không cho phép các 
toán hạng tức thời, vì thế việc truyền một hằng như là một tham số 
phài cần 2 chỉ thị. Ta hãy hào phóng cho Intel điểm c do những cô" 
gắng của họ. 

Khi thiết kê 80386, cuối cùng các kỹ sư của Intel đã quyết dinh 
xây dựng một CPU có thể làm cho họ hãnh diện thay vì một CPU 
với mọi thứ phải tương thích với 8088. Kết quả là các kiểu định địa 
chí 32-bit của 80386 dều có quy luật hợp lý và tổng quát, và có 
thêm byte SIB khá mạnh. Đỏi với đa sô" mục đích, khả năng định 
địa chỉ của các chip 80386 và 68030 gần giông nhau. 

Chúng ta đă thấy bao nhiêu rắc rốì do thiếu bít gây ra. Thí dụ 
68030 không thế dùng các thanh ghi D cho hầu hết các kiểu định 
địa chỉ cơ bản bời vì một trường 4-bit là quá lớn. Tuy nhiên vẫn có 
thê có một giải pháp khác. Giải pháp này không sứ dụng trong 
Intel và Motorola, nhưng được dùng trong DEC VAX, đơn giản là 
dùng nhiều bit hơn. Trường kiểu / thanh ghi có 6-bit trong PDP-11 
và 68000 được mớ rộng thành 1 byte trong máy VAX, với 4 bit cho 
trường kiểu và 4 bít cho trường thanh ghi. Sơ dồ này cho phép 16 
thanh ghi được địa chỉ hóa cũng như cho phép có thêm nhiều kiểu, 
nhưng điều này có nghĩa là 1 chỉ thị 2 toán hạng dài tối thiểu 3 
byte, một byte cho opcode và một byte cho mỗi một toán hạng. 

Đên đây ta đã hoàn tất việc khảo sát về những thỏa hiệp khác 
nhau có thể có giữa opcode và địa chỉ, và các dạng định địa chỉ 
khác nhau. Khi tiếp cận một máy vi tính mới ta nên khảo sát tập 
các chỉ thị và các khả năng địa địa chỉ, không chỉ để xem những chỉ 
thị, những kiểu định địa chỉ nào được dùng mà còn để hiểu tại sao 
có những chọn lựa này và kết quả của chúng. 
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5.4 CÁC LOẠI CHỈ THỊ 

Các chỉ thị ở cấp máy quy ước một cách gần đúng được phân 
thành 2 nhóm : các chỉ thị đa nãng ( general-purpose ) và các chỉ 
thị chuyên dụng ( special-purpose ). Các chỉ thị đa năng được ứng 
dụng rộng rãi. Thí dụ khả năng di chuyển dữ liệu trong máy là điều 
cần thiết trong hầu hết mọi ứng dụng. Các chỉ thị chuyên dụng có 
những ứng dụng hẹp hơn. Thí dụ chỉ thị MOVEP của 68000 lấy nội 
dung của thanh ghi D và cất vào trong bộ nhớ theo cách xen kẻ 
byte, có 1 byte không dùng ở giữa 2 byte dữ liệu. Một vài ứng dụng 
sử dụng hiệu quả chỉ thị này và chưa có trình biên dịch nào tạo ra 
nó. ( chỉ thị này nhằm đơn giản hóa việc truyền thông với các chip 
ngoại vi 8-bit cũ ). Trong những phần sau ta sẽ bàn đến các nhóm 
chỉ thị đa nàng chính. 

5.4.1 Các chỉ thị di chuyển dừ liệu 

Sao chép dừ liệu từ nơi này sang nơi khác là thao tác cơ bản 
nhất trong tất cả thao tác. Bằng cách sao chép chúng ta muốn tạo 
ra một đôi tượng mới có mẫu bit giống hệt mẫu ban đầu. Việc dùng 
từ “ di chuyển ” có hơi khác với cách dùng quen thuộc trong tiếng 
Anh. 

Khi ta nói Marvin Mongoose vừa di chuyển từ New York tới 
Caliíbrnia, không có nghĩa là một bản sao ông Mongoose được tạo 
ra ở Caliíbrnia mà ông ta vẫn còn ở New York. Khi ta nói rằng nội 
dung của vị trí nhớ 2000 vừa được chuyến tới một thanh ghi nào đó, 
có nghĩa là ta đã có 1 bản sao nội dung ban đầu trong thanh ghi mà 
vẫn không hủy nội dung trong vị trí nhớ 2000. Các chỉ thị di 
chuyển dữ liệu tô't hơn nên gọi là các chỉ thị “ tạo bản sao dữ 
liệu " ( data duplication ), nhưng thuật ngữ “ di chuyển dữ liệu n 
( data movement ) đã được thiết lập. 

Dừ liệu được cất ở nhiều nơi khác với cách các từ được truy xuất. 
Thực tế có 3 nơi thông thường là trong một từ nhớ, trong một 
thanh ghi hoặc trong stack. Các truy xuất stack khác với cách truy 
xuất bộ nhở chuẩn. Việc truy xuất bộ nhớ cần 1 địa chỉ trong khi 
việc câ't một phần tử vào stack không cần địa chỉ rõ ràng. Các chỉ 
thị di chuyển dữ liệu yêu cầu cả nguồn ( vị trí ban đầu ) và đích của 
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thông tin { nơi đặt bản sao ) phải được xác định hoặc một cách rõ 
ràng hoặc một cách ẩn dụ. 

Chỉ thị di chuyển dữ liệu phải cho biết bằng cách này hay cách 
khác lượng khôi lượng dữ liệu được di chuyển. Các chỉ thị di chuyển 
dữ liệu hiện nay có lượng dữ liệu cần di chuyển trong tầm từ 1 bít 
tới toàn bộ bộ nhớ. Trên những máy có chiều dài từ cô' định, sô' các 
từ được đi chuyển thường được xác định bởi lệnh, thí dụ các chỉ thị 
riêng biệt để chuyển 1 từ và nửa từ. Các máy có chiều dài từ thay 
đổi thường có các chỉ thị chỉ chỉ cần xác định địa chỉ nguồn và địa 
chỉ đích, không cần xác định lượng dữ liệu. ViệỀ^di chuyển dừ liệu 
tiếp tục cho đến khi dấu hiệu kết thúc vùng dữ liệu ( end-of-data 
íĩeld mask ) được tìm thấy ngay trong chính dữ liệu. 

680x0 có một chỉ thị MO VE đa năng với 2 toán hạng tùy ý như 
trình bày trong hình 5.23. Chỉ thị này có thể di chuyển dữ liệu giữa 
các thanh ghi, bộ nhớ hoặc một nơi bất kỳ trong stack. Các CPU 
của Intel các chỉ thị MO VE với nhiều hạn chế hơn ( nhưng có nhiều 
chỉ thị loại này ), vì thê cũng có thể di chuyển bất cứ cái gì tới bất 
cứ nơi đâu. 

5.4,2 Các thao tác nhị nguyên 

Các thao tác nhị nguyên ( dyađic operation ) là những thao tác 
kêt hợp 2 toán hạng để sinh ra một kết quả. Hầu hết các máy cấp 2 
đều có các chỉ thị thực hiện phép cộng và phép trừ trên sô" nguyên. 
Trừ các máy vi tính 8-bit, phép nhân và phép chia các sô" nguyên 
cũng là các phép toán chuân. Có lẽ không cần phải giải thích tại 
sao các máy tính được trang bị với các chỉ thị sô' học. 

Một nhóm các thao tác nhị nguyên khác bao gồm các chỉ thị đại 
sô logic. Mặc dù có 16 hàm đại sô logic trên 2 biến, nhưng chỉ có 
vài máy cấp 2 ( nếu không muốn nói là không có ) có các chỉ thị cho 
cả 16 hàm. Thí dụ hàm cho kết quả là đúng ( TRƯE ), độc lập với 
dối số, là hàm không cần thiết. Nếu mẩu bit là TRUE ớ nơi nào đó 
trong máy dược cần đến, chỉ cần di chuyền mẫu bit tới hơn là tính 
toán. Một chỉ thị thực hiện hàm f ( P,Q ) = p đúng là vô ích. 
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3 chỉ thị hiện diện trên nhiều máy là AND, OR và EXCLƯSIVE 
OR. Trên những máy có chiều dài từ cô' định, chỉ thị AND tính tích 
logic từng bit của 2 đôi sô 1-từ và cho kết quả cũng là 1 từ. Cũng 
tồn tại các chỉ thị như vậy cho các đỏi sô byte và từ kép. Những 
nhận xét tương tự cũng áp dụng cho các phép toán đại số logic 
khác. 

Một ứng dụng quan trọng của chỉ thị AND là để trích lây các 
bit ra khỏi từ. Thí dụ xét một máy có chiều dài từ 32-bit trong đó 
mỗi từ sẽ chứa 4 ký tự 8-bit. Giả sử cần tách riêng ký tự thứ 2 ra 
khỏi 3 ký tự kia để in ra ; ta cần tạo ra một từ chứa ký tự cần tách 
trong 8 bit tận cùng bên phải, được xem như là canh phải, và 24 bit 
còn lại bằng 0. 

Để tách lấy ký tự, từ chứa ký tự đó được AND với một hằng số, 
gọi là mặt nạ ( mask ) sao cho kết quả cua phép toán này là tất cả 
các bit không mong muôn đều được thay bằng zeronhư trình bày 
dưới đây, 

10110111 10111100 11011011 10001011 A 

00000000 11111111 00000000 00000000 B ( mặt nạ ) 

00000000 10111100 00000000 00000000 A AND B 

Kết quả này sau đó được dịch 16 bit sang phải để tách riêng ký tự ở 
đầu bên phải của từ. 

ứng dụng quan trọng của chỉ thị OR là kêt họp các bit vào 
trong một từ, kết hợp là công việc ngược với trích ra. Để thay đổi 8 
bit tận cùng bên phải của một từ 32 bit mà không làm xáo trộn 24 
bit kia, trước tiên 8 bit không mong muôn được che và sau đó OR 
với ký tự mới, như trình bày dưới đây, 

10110111 10111100 11010100 10001011 A 
11111111 mnm mmn 00000000 B (mặt nạ) 

10110111 10111100 11011011 00000000 A AND B 

00000000 Q0QQ0000 00000000 01010111 c 


10110111 10111100 11011011 01010Ị11 (AANDB)ORC 







356 


Cấu trúc Máy tính 


Ị£1 


Phép toán AND có xu hướng loại bỏ các bit 1 vì không bao giờ 
có nhiều bit 1 trong kết quả hơn so với cả 2 toán hạng. Phép toán 
OR có xu hướng chèn thêm bit 1 vì ít nhất số^ bit 1 trong kết quả 
cũng bằng với số bit 1 có trong toán hạng. Phép toán EXCLUSIVE 
OR lại có tính đối xứng, có xu hướng tính trung bình, không chèn 
thêm cũng không loại bỏ các bit 1. Tính đối xứng này đối với bit 1 
và bit 0 đôi khi lại có ích, thí dụ trong việc tạo ra “ các số ngẫu 
nhiên 

Những máy tính ban đầu thực hiện các phép tính sô" học trên số 
dấu chấm động ( íloating-point ) bằng cách gọi thủ tục, nhưng ngày 
nay nhiều máy tính, đặc biệt là những máy dùng cho công việc kỹ 
thuật, có các chỉ thị dấu châm động ở câp 2 do nhiều lý do về tốc 
độ. Một số máy cung cấp một số chiều dài của số dâu chấm động, 
các số ngắn hơn để dùng trong trường hợp tốc độ là cần thiết, và 
các sô dài hơn dùng trong các trường hợp cần có độ chính xác. 

5.4.3 Các thao tác đơn nguyên 

Các thao tác đơn nguyên có một toán hạng và tạo ra một kết 
quả. Do các thao tác đơn nguyên cần ít địa chỉ hơn các thao tác nhị 
nguyên nên các chỉ thị đôi khi cũng ngắn hơn. 

Các chỉ thị dịch hoặc quay nội dung của một từ hoặc một byte 
rât hữu dụng và thường có nhiều biến thể khác nhau. Dịch là thao 
tác trong đó các bit được chuyển sang trái hoặc phải, các bit được 
dịch ra khỏi một đầu của từ sẽ bị mất. Thao tác quay là thao tác 
dịch trong đó các bít được đẩy ra khỏi đầu này nhưng xuất hiện lại 
ở đầu kia. Sự khác nhau giữa dịch và quay dược minh họa dưới đây, 

00000000 00000000 00000000 01110011 A 

00000000 00000000 00000000 00011100 A được dịch phải 2 bit 

11000000 00000000 00000000 00011100 A được quay phải 2 bit 

Cả hai thao tác dịch phải / trái và quay phải / trái đều có ích. 
Khi một từ rc-bit được quay trái k bit sẽ cho cùng kết quả với việc 
quay phải từ này ( n-k ) bit. 
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Thao tác dịch phải thường được thực hiện với sự mở rộng dâu. 
Điều này có nghĩa là các vị trí dã bỏ trống ớ đầu bên trái của từ 
được làm dầy bằng bit dấu ban đầu, 0 hoặc 1 như thể là bit dâ"u 
được kéo dọc sang phải, cũng có nghĩa là một sô" âm vẫn sẽ là một 
số âm. Tình huống này được minh họa bằng thao tác dịch phải 2-bit 
dưới đây, 

11111111 11111111 11111111 11110000 A 

00111111 11111111 11111111 11111100 A dịch không mở rộng dấu 

11111111 11111111 11111111 11111100 A dịch có mở rộng dấu 

Một ứng dụng quan trọng của thao tác dịch là nhân và chia với 
các số lũy thừa cúa 2. Nếu một sô" nguyên dương được dịch trái k bit 
nghĩa là sô" ban đầu được nhân với 2 k để cho kết quả, ngoại trừ số 
tràn. Nếu một sô" nguyên dương được dịch phải k bit, kết quá là số 
ban đầu chia cho 2 k . 

Thao tác dịch còn được dùng đê tăng tốc độ cho các phép toán 
số học. Thí dụ để tính 18 X n với n là số nguyên dương. Bới vì 
18 X Ti = 16 X n + 2 X n, tả nhận được 16 X n bằng thao tác dịch một 
bản sao n lần 4 bít sang trái. 2 X n nhận dược bằng cách dịch n lần 
1 bit sang trái. Tổng của 2 sô này là 18 X 71 . Phép nhân được thực 
hiện bằng một thao tác di chuyên, 2 thao tác dịch và một thao tác 
cộng thường sẽ nhanh hơn so với việc thực thi phép nhân. 

Tuy nhiên việc dịch các sô âm, ngay cả với các sô có mở rộng 
dâ"u, sẽ cho kết quả hoàn toàn khác. Thí dụ xét sô -1 ở dạng bù-1. 
Dịch 1 bit sang trái cho kết quả là -3. Dịch 1 bit khác sang trái cho 
kết quả sẽ là -7 : 

11111111 11111111 11111111 11111110 -1 trong số bù-1 

11111111 11111111 11111111 11111100 -1 dịch trái 1 bit =-3 

11111111 11111111 11111111 11111000 -1 dịch trái 2 bit =-7 

Dịch trái các số âm dạng bù-1 không phải là nhân với 2. Tuy 
nhiên dịch phái mô phỏng chính xác một phép chia. 
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Bây giờ hãy xét sô' âm -1 ở dạng bù-2. Khi dịch phải 6 bit có 
mổ rộng dấu, kết quả sinh ra —1, kêt quả này không đúng vì phần 
nguyên của -1/ 64 là 0 : 

111111X1 11111111 11111111 11111111 -1 ở dạng bù-2 

11111111 11111111 11111111 11111111 -1 được dịch phải 6 bit =-1 

Tuy nhiên, dịch trái là sự mô phỏng của phép nhân 2. 

Thao tác vụ quay hữu dụng khi cần kết hợp chuỗi bit vào trong 
một từ và lấy chuỗi bit ra khỏi một từ. Nếu muôn kiểm tra tất cả 
bit trong 1 từ, quay từ đó từng bit một liên tiếp và đặt từng bit vào 
bit dâu, nơi bit được kiểm tra dễ dàng và cũng cất lại từ dó với giá 
trị ban đầu khi tất cả bit đã kiểm tra xong. 

Các máy mà chúng ta dùng làm thí dụ đều có nhiều dạng chỉ thị 
dịch và quay theo cả 2 hướng. Một số chỉ thị còn bao hàm cả bit 
nhớ ( carry bit ). Tuy nhiên điều này thực sự không quan trọng vì 
thực tế trình biên dịch không tạo ra chỉ thị nào trong sô' đó cả 
ngoại trừ chỉ thị dịch trái, một phương pháp tôi ưu để nhân với sô 
lũy thừa của 2. 

Các thao tác nhị nguyên thường xảy ra với các toán hạng đặc 
biệt, ở các máy cấp 2 đôi khi có các chỉ thị đơn nguyên thực hiện 
chúng một cách nhanh chóng. Di chuyển zero vào một từ nhớ*hoặc 
một thanh ghi là thao tác rất phổ biến khi khởi động một phép 
tính. Dĩ nhiên, thao tác di chuyền zero là một trường hợp đặc biệt 
của các chỉ thị di chuyên dữ liệu. Đế có hiệu quả, thao tác xóa 
( CLEAR ) với 1 dịa chỉ được dừng để xóa. 

Cộng 1 với một từ cũng thường được dùng để đếm. Dạng đơn 
nguyên của chỉ thị cộng là thao tác tăng, nghĩa là cộng 1. Thao tác 
lây bù ( negate ) là một thí dự khác. Lấy bù X thực chất là tính 
0 - X, một phép trừ nhị nguyên, nhưng để gia tăng hiệu quả tính 
toán, đôi khi máy cũng cung cấp chỉ thị NEGATE. 

Các CPU của Intel dều có các chỉ thị INC và DEC để cộng hoặc 
trừ 1. 680x0 có những chỉ thị tổng quát hơn, ADDQ và SUBQ, là 
các chỉ thị cộng với hoặc trừ cho một hằng sô' trong tầm từ X đến 8. 
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5.4.4 So sánh và nhảy có diều kiện 

Hầu như tất cả các chương trình đều cần khả năng kiểm tra dữ 
liệu và thay đổi chuỗi chỉ thị được thực hiện dựa vào kết quả. Thí 

dụ đơn giản là hàm lấy căn bậc hai, . Nếu X âm thủ tục cho 

một thông báo lỗi ; ngược lại, thủ tục tính cãn bậc 2. Hàm sqrt phải 
kiểm tra X và sau đó nhảy, tùy thuộc vào X có âm hay không. 

Một phương pháp thõng thường để thực hiện công việc như vậy 
là sử dụng các chỉ thị nhảy có điều kiện { thường gọi là rẽ nhánh có 
điều kiện ), chúng kiểm tra điều kiện nào đó và nhảy tới một địa 
chỉ bộ nhớ cụ thể nếu điều kiện dược thỏa. Đỏi khi có thể thiết lập 
một bit trong chỉ thị là 1 hoặc 0, nghĩa là thực hiện nháy nếu điều 
kiện thỏa hoặc nếu điều kiện không thóa. 

Điều kiện được kiểm tra thông thường nhất là bit cụ thể trong 
máy có là 0 hay không. Nếu một chỉ thị kiểm tra bit dấu cùa một sô 
bù-2 và nhảy tới LABEL nếu bit dâu là 1, các phát biếu bắt dầu ớ 
LABEL được thực thi nếu sô đó ám, ngược lại các phát biếu theo 
sau chỉ thị nhảy có điều kiện sẽ được thực thi nếu sô đó bằng 0 
hoặc dương. Thực hiện kiểm tra giống như vậy trên sô bù-1 sè luôn 
luôn nhảy tới LABEL nếu số dược kiểm tra nhỏ hơn hoặc bằng -1, 
và sẽ không bao giờ nhảy tới LABEL nếu sô được kiểm tra lớn hơn 
hoặc bằng 1. Nếu sô' dó là 0, việc nhảy có thê xảy ra hoặc không 
phụ thuộc vào +0 hay -0. Rõ ràng là không dễ chịu, bới vì theo toán 
học +0 = -0. Đây là một trong những lý lẽ mạnh mẽ nhát chông lại 
sô' bù-1 và ủng hộ số bù-2. 

Nhiều máy sứ dụng một số bit đê cho biét nhừng điều kiện cụ 
thể. Thí dụ, bit tràn ( overflow bit ) dược thiẽt lập là 1 mồi khi một 
phép toán sô' học cho một kết qua sai. Kiếm tra bit này người ta 
kiểm tra được sự tràn của phép toán số học trước, vì thê nêu xáy ra 
tràn, chương trình có thề nhảy tới một thường trình lỗi ( error 
routine ). 68000 có một chỉ thị đặc biệt và ngắn, TRAPV, đế bẫy 
(trap ) nếu bit tràn là 1. 

Tương tự, một số bộ xứ lý có X bit nhớ ( carry bit ) dược thiết 
lập khi có sô' nhớ xuất hiện ở bit tận cùng bên trái, thí dụ cộng 2 số 
âm. Có số nhớ từ bít tận cùng bên trái là hoàn toàn bình thường và 
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không nên lầm lẩn với bít tràn, cần phải kiểm tra bit nhớ đối với 
phép tính sô' học có độ chính xác bội ( multiple-precision arlthmetic). 

Một số máy có chỉ thị. kiểm tra bit tận cùng bên phải của từ. 
Chỉ thị này cho phép chương trình kiếm tra một sô' ( dương ) là lẻ 
hay chẵn trong một chỉ thị nào đó. 

Việc kiểm tra zero lại quan trọng đối với các vòng lặp và cho 
nhiều mục đích khác. Nếu tâ't cả chỉ thị nhảy có điều kiện chỉ kiểm 
tra 1 bit, để kiểm tra một từ cụ thể có bằng 0 hay không, người ta 
phải kiềm tra riêng từng bit để bảo đảm không có bit nào là 1. Để 
tránh tình huống này, nhiều máy có chỉ thị kiểm tra từ và nhảy 
nếutừ đó bằng 0. Thực tế, phần cứng thường có một thanh ghi mà 
tất cả các bít của thanh ghi này được OR với nhau nhằm cung cấp 
một bit cho biết thanh ghi có chứa bit 1 nào không. 

So sánh 2 từ hoặc 2 ký tự xem chúng có bằng nhau không, nếu 
không bằng, từ nào hoặc ký tự nào lớn hơn sẽ quan trọng trong việc 
sắp xếp thứ tự. Để thực hiện kiểm tra này ta cần có 3 địa chỉ, 2 cho 
các phần tử dữ liệu, và 1 cho địa chỉ nhảy tới nếu điều kiện là 
đúng. Các máy tính mà dạng chỉ thị cho phép 3 địa chỉ mỗi chỉ thị 
sẽ không có vấn đề gì, nhưng với các máy không cho phép chĩ thị 3 
địa chỉ, phải làm điều gì đó để khắc phục vấn đề này. 

Giải pháp thông thường là cung câ'p chỉ thị thực hiện việc so 
sánh và thiết lập 1 hoặc nhiều bít điều kiện để ghi lại kết quả. Chỉ 
thị tiếp theo sau kiểm tra các bit này và nhảy nếu 2 giá trị cần so 
sánh bằng nhau, hoặc không bằng nhau, hoặc nếu giá trị đầu lớn 
hơn và v.v... Cả 2 loại CPU trong các thí dụ của chúng ta trên đều 
dùng phương pháp 'này. 

Một số điếm tế nhị bao hàm trong việc so sánh 2 số. Trước tiên, 
trên những máy sứ dụng dạng bù-1, +0 và -0 khác nhau ; thí dụ 
trên một máy 32-bit, 

00000000 00000000 00000000 00000000 +0 trong số bù-1 

11111111 11111111 11111111 11111111 -0 trong số bù-1 

Các nhà thiết kế phải quyết định +0 và -0 có bằng nhau hay 
không, nếu không bằng sô' nào lớn hơn. Vân dề không phải là cách 
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nào được quyêt định, có nhiều lý lẽ có sức thuyết phục nhưng lại 
cho một quyết định sai. Nếu các nhà thiết kê cho rằng +0 = -0, 
phép so sánh cho kết quả là bằng nhau nhưng không có nghĩa là 
các mẫu bit của các phần tư dữ liệu được so sánh giông nhau. Xét 
một máy với 1 từ 32-bit trong đó chứa 4 ký tự 8-bit. Nếu mã của 4 
ký tự là 0 được cất trong 1 từ, thì từ đó sẽ chứa 32 bit 0. Nếu mã 
của 4 ký tự là 255, thì từ đó sẽ chứa 32 bít 1. Nếu 2 từ này so sánh 
là bằng nhau vì +0 = -0, một chương trình xử lý văn bản cũng kết 
luận sai lầm rằng 2 từ có 4 ký tự giôìig nhau. 

Mặt khác, nếu phần cứng xem -0 và +0 không bằng nhau, kết 
quả của việc cộng -1 với +1 và so sánh kết quả với +0 cũng không 
bằng nhau, bởi vì -1 cộng với +1 sẽ cho kết quả là —0. Không cần 
phải nói, đây là một tình trạng không mong muôn. Các máy sử 
dụng số bù-2, bao gồm các thí dụ của chúng ta không có vấn đề gì 
với +0 và -0, các máy sử dụng sô bù-1 dần dần sẽ bị mất hẳn. 

Một điểm tê nhị khác liên quan tới việc so sánh các sô" cho dù 
các sô dó được xem là có dấu hay không. Các sô nhị phân 3-bit có 
thể xếp thứ tự theo 1 trong 2 cách. Từ nhó nhất tới lớn nhát : 


Không dấu 

Có dấu 


000 

100 

( nhó nhất ) 

001 

101 


010 

110 


011 

111 


100 

000 


101 

001 


110 

010 


111 

011 

( lớn nhất ) 


Cột bên trái trình bày các sô' nguyên dương từ 0 tới 7 theo trật 
tự tăng dần. Cột bên phải trình bày các số nguyên có dâu dạng 
bù-2 từ -4 tới +3. Lời giải cho câu hỏi : “ 011 có lớn hơn 100 
không ? ” tùy thuộc vào các số có được xem là có dấu hay không. Đa 
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số các CPU, kế cá cùa Intel và Motorola, đều có các chỉ thị nhảy 
cho cá 2 loại trật tự này. 

Các CPU với ít hơn 3 địa chi cho mỗi chỉ thị đôi khi điều khiển 
nháy có điều kiện bàng một chi thị bỏ qua chỉ thị kế tiếp sau nếu 
điều kiện thỏa mân. Chí thị như vậy thường là một chỉ thị nhảy. 
Trên một sô' máy bó qua nhiềuchí thị thay vì chí một, sô' byte bị bỏ 
qua được xác định ngay trong chính chí thị đó. Tiêu biểu là một sô 
từ -128 tới +127 đặt vừa trong 1 byte. 68000 có nhiều chỉ thị loại 
này. 

Nhay không điểu kiện là trường hợp đặc biệt của nhảy có diều 
kiện trong đó diều kiện luôn luôn được thóa. 

5.4,5 Các chỉ thị gọi thủ tục 

Thủ tục là một nhóm chì thị thực hiện một công việc nào đó và 
có thế được gọi từ nhiều nơi trong chương trình. Thuật ngữ 
subroutinc thường được dùng thay cho procedure, đặc biệt khi nhắc 
đến các chương trinh hợp ngữ. Khi thú tục hoàn tảt công việc, thủ 
tục phái trớ vể phát biêu sau chí thị gọi. Do đó, dịa chí trở về phải 
được truyền đến thủ tục. 

Địa chi trờ về có thê được đặt ỡ một trong 3 nơi : bộ nhớ, thanh 
ghi hoặc stack. Giải pháp xấu nhất là đặt địa chỉ này trong một vị 
trí nhớ cố định. Trong sơ đồ này, nếu thu tục đó lại gọi một thủ tục 
khác, lần gọi thứ 2 sẽ làm cho dịa chi trỡ về của lần gọi thứ nhất bị 
mất. 

Một cải tiến nhó là có chi thị gọi thu tục cất địa chỉ trở về trong 
từ đầu tiên của thủ tục, còn chi thị có thê thực thi đầu tiên ở trong 
tự thứ 2. Sau đó thu tục có thế trớ về bằng cách nhảy gián tiếp tới 
từ đầu tiên hoặc nếu phẩn cứng dặt opcode cho chi thị nhảy ở từ 
dảu tiên cùng với dịa chi trớ vẽ, nhay trực tiếp tới đó. Thú tục có 
thế gọi những thú tục khác, bơi vì mỗi thủ tục đều có không gian 
cho địa chi trớ về. Nếu thủ tục gọi lại chính thủ tục, sơ đồ này sẽ 
thất bại, bơi vì địa chỉ trờ về thứ nhất sẽ bị hủy bơi lần gọi thứ 2. 
Khả năng thu tục gọi chính thủ tục được gọi là sự đệ 
qui ( recursion ), rất quan trọng đối với cả các lý thuyết gia và 
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người lập trình. Hơn nữa, nếu thú tục A gọi thú tục B, thủ tục B gọi 
thủ tục c và thủ tục c gọi thủ tục A ( đệ quy gián tiếp ), sơ đồ này 
cũng bị thất bại. 

Một cải tiến lớn hơn là có chỉ thị gọi thú tục đặt địa chỉ trờ về 
trong thanh ghi, đế trách nhiệm cất địa chỉ trở về vào một nơi an 
toàn cho thủ tục. Nếu thủ tục là đệ quy, thủ tục sẽ phái đặt địa chỉ 
trớ về vào một nơi khác mồi lần thú tục được gọi. 

Tcít nhất là có chi thị gọi thủ tục cất địa chỉ trỡ về vào stack. 
Khi thủ tục hoàn tất, thủ tục lây địa chi trớ về ra khỏi stack và đưa 
địa chỉ này vào bộ đếm chương trình.Khi sử dụng dạng gọi thủ tục 
này, phép gọi đệ quy không gây ra bất kỳ vấn đề đặc biệt nào ; địa 
chỉ trở về sẽ tự động được cất theo cách như vậy đề tránh hũy địa 
chỉ trở về trước đó. Tất cá các CPU trong các thí dụ cùa chúng ta 
dều dùng phương pháp này. 

5.4.6 Điều khiển vòng lặp 

Nhu cầu thực thi một nhóm chỉ thị với một sô' lần cô' định xảy 
ra thường xuyên nên một sô' máy có các chỉ thị nhằm dễ dàng thực 
hiện điều này. Tất cả sơ đồ đều bao gồm một bộ đếm được tăng 
hoặc giảm bởi một hằng sô nào đó mỗi lần qua vòng lặp. Bộ đếm 
củng được kiểm tra mỗi lần qua vòng lập, nếu điều kiện đúng vòng 
lặp được kết thúc. 

Phương pháp này khởi động bộ đếm ỡ ngoài vòng lặp và sau đó 
bắt đầu thực thi ngay mà vòng lặp. Chì thị cuối cùng của vòng lặp 
sè cập nhật bộ đếm và nếu điều kiện kết thúc chưa thỏa sẽ quay trớ 
lại chỉ thị đầu tiên của vòng lặp. Ngược lại, vòng lặp kết thúc và 
thực thi chỉ thị đầu tiên ớ ngoài vòng lặp. Dạng lặp vòng này đặc 
trưng cho lặp vòng loại kiểm tra ớ cuối ( test-at-the-end ) được minh 
họa trong hình 5.40(a). 

Lặp vòng loại kiểm tra ơ cuối có đặc tính là vòng lặp luôn luôn 
được thực thi tôi thiểu 1 lần ngay cả khi n < 0. Hãy khảo sát một 
chương trình bảo quản các hồ sơ cá nhân của một công ty và 
chương trình dang dọc thông tin của một nhân viên, đang ở trong 
vòng lặp n lần với n là sô' con của nhân viên này, mồi lần cho một 
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đứa con, đang đọc tên, giới tính và ngày sinh dể công ty gởi cho 
người con một món quà sinh nhật, một trong những phúc lợi phụ 
của công ty. Nếu người nhân viên không có con nghĩa là n = 0, vòng 
lặp vẫn được thực thi 1 lần gới quà và cho kết quả không đúng. 

i := 1; i := 1 

1: ( phát biểu dầu tiên ) 1 : if i > n then goto 2; 

( phát biểu thứ hai ) ( phát biểu đầu tiên ) 

( phát biểu thứ hai ) 


( phát biếu cuối cùng ) 

i := i + 1; ( phát biểu cuối cùng ) 

If i < = n then goto 1; i := i + 1; 

2 : ( phát biểu đầu tiên goto 1; 

sau vòng lặp ) 2 : ( phát biểu đầu tiên jsau vòng lặp ) 

(a) (b) 

Hình 5.40 (a) Vòng lập kiểm tra ở cuô'i (b) Vòng lặp kiểm tra ở đầu 

Hình 5.40(b) trình bày một phương pháp khác thực hiện việc 
kiểm tra làm việc dứng ngay khi n nhỏ hơn hoặc bằng 0. Lưu ý là 
việc kiểm tra trong 2 trường hợp là khác nhau, và nếu một chỉ thị 
câp 2 thực hiện cả 2 việc kiểm tra và tăng, bắt buộc nhà thiết kế 
phải chọn phương pháp này hay phương pháp kia. 

Xét mã được sinh ra cho phát biểu Pascal 

for i:=l to n do begin ... end 

Nếu trình biên dịch không có một thông tin nào về n , trình này 
phải dùng phương pháp trong hình 5,40(b) để diều khiển đúng 
trường hợp n < 0. Tuy nhiên, nếu có thể xác định n > 0, thí dụ bằng 
cách xem n được gán ở đâu, trình biên dịch dùng mã trong hình 
5.40(a) tốt hơn. Ngôn ngữ FORTRAN chuẩn trước đây phát biẹu 
rằng tất cả vòng lặp đều được thực thi một lần cho phép mã hiệu 
quả hơn của hình 5.40(a) lúc nào cũng dược tạo ra. Vào năm 1977, 
khuyết điểm đó được hiệu chỉnh ngay khi nhóm ngôn ngữ 
FORTRAN bắt đầu nhận ra rằng, phát biểu lặp với ngữ nghĩa kỳ lạ 
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không phải là ý tướng hay dù cho có tiết kiệm được một chỉ thị 
nhảy cho mỗi vòng lặp. 

Tất cả CPU của Intel đều lặp lại một sô" lần cố định bằng cách 
dùng chỉ thị LOOP, chỉ thị làm giảm CX/ECX di 1 và nhảy tới nhãn 
đâ cho nếu kết quả khác 0. Nếu kết quả bằng 0, bỏ qua vòng lặp và 
tiếp tục thực hiện chì thị kế tiếp. 

680x0 có một chí thị tổng quát hơn, trước tiên kiềm tra các má 
điều kiện với một điệu kiện đã cho, bỏ qua vòng lặp nếu điều kiện 
đúng. Nếu điều kiện sai, giảm thanh ghi D đi 1. Nếu kết quả là 0 
hoặc lớn hơn, vòng lặp được lặp lại ; ngược lại kết thúc vòng lặp và 
chỉ thị theo sau vòng lặp được thực hiện. 

5.4.7 Xuất / nhập 

Không có nhóm chi thị nào của các máy biểu lộ nhiều tính đa 
dạng như chỉ thị xuất / nhập ( I/O ). Hiện có 4 sơ đồ khác nhau 
đang sử dụng. Đó là : 

1. Xuât / nhập theo chương trình có đợi bận 

2. Xuất / nhập có điều khiển ngắt 

3. Xuất / nhập truy xuất trực tiếp bộ nhớ ( DMA ) 

4. Xuât / nhập sử dụng các kênh dừ liệu 

Bây giờ chúng ta sẽ tháo luận lần lượt từng sơ đồ này. 

Có lè phương pháp xuất / nhập đơn giản nhât là xuât / nhập 
theo chương trình ( programmed I/O ). Các máy vi tính có một chỉ 
thị nhập { input instruction ) và một chí thị xuât ( output 
instruction ). Mỗi chỉ thị sẽ chọn một trong các thiết bị I/O. Một ký 
tự được truyền giữa một thanh ghi cố định trong bộ xử lý và thiết bị 
I/O được chọn. Bộ xử lý phải thực thi một chỉ thị rõ ràng từng chỉ 
thị cho mỗi một ký tự được đọc hoặc ghi. 

Thí dụ đơn giản của phương pháp này là xét một thiết bị đầu 
cuối có 4 thanh ghi 1-byte như trình bày trong hình 5.41. Dùng 2 
thanh ghi đẽ nhập, trạng thái và dữ liệu và 2 thanh ghi đề xuất, 
trạng thái và dữ liệu. Mỗi thanh ghi có duy nhất một địa chỉ. Nếu 
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dùng xuất nhập ánh xạ bộ nhớ ( memory-mapped I/O ), tất cả 4 
thanh ghi là 1 phần của không gian địa chỉ và có thể đọc và ghi 
bằng cách dùng các chỉ thị thông thường. Mặt khác, các chỉ thị I/O 
đặc biệt, chẳng hạn IN và OUT, được cung câp đề đọc và ghi. Trong 
cả 2 trường hợp, I/O được thực hiện bằng cách truyền dữ liệu và 
thông tin trạng thái giữa CPU và các thanh ghi này. 



Interrrupt avaìlable 



Interrrupt enabled 


Keyboard butier 
Character recelved 


Display buffer 
Character to dísplay 


Hình 5.41 Các thanh ghi cua một thiết bị đầu cuối đơn gián 

Character available : ký tự có giá trị 
Keyboard status : thanh ghi trạng thái bàn phím 
ínterrupt available : ngất có giá trị 
Keyboard buffer : thanh ghi đệm bàn phím 
Character reveived : ký tự nhận được 
Ready for next character : sần sàng cho ký tự kế 
Display status : thanh ghi trạng thái màn hình 
Display buffer : thanh ghi dệm màn hình 
Character to display : ký tự dề hiến thị 

Thanh ghi trạng thái bàn phím sứ dụng 2 bít và có 6 bit chưa sử 
dụng. Bit tận cùng bẽn trái { 7 ) được thiết lập là 1 bới phần cứng 
mỗi khi có một ký tự. Nếu phần mềm đã thiết lập bit 6 trước đó, có 
một ngắt phát sinh, ngược lại ngắt không dược tạo ra. Khi xuất / 
nhập theo chương trình, đê nhập bình thường CPU ở trong một 
vòng lặp lặp lại việc đọc thanh ghi trạng thái bàn phím, đợi bit 7 
dược thiết lập. Khi bit 7 được thiết lập, chương trình đọc thanh ghi 
đệm bàn phím để nhận ký tự đó. Việc đọc thanh ghi dữ liệu bàn 
phím sẽ làm cho bit READY được thiết lập lại là 0. 
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Việc xuất cũng thực hiện theo cách tương tự. Đề ghi ký tự lẻn 
màn hình, trước tiên phần mềm đọc thanh ghi trạng thái màn hình 
xem bít READY có bằng 1 hay không. Nếu không, chương trinh sc 
lặp vòng cho tới khi bit này lên 1, cho biết rằng thiết bị sán bang 
nhận một ký tự. Ngay khi thiết bị cuối sẵn sàng, phần mềm ghi 
một ký tự lên thanh ghi đệm màn hình và ký tự được truyền lên 
màn hình. Việc ghi này làm cho thiết bị xóa bit READY irong 
thanh ghi trạng thái màn hình. Khi ký tự dã dược thể luộn và thiết 
bị đầu cuối được chuẩn bị đê nhận ký lự kế tiếp, bít KEADY tự 
động được thiết lập là 1 lần nữa do tác dộng của bộ điều khiến. 

Một thí dụ về xuất / nhập theo chương trình là xét thù tục 

Pascal trong hình 5.42. Gọi thú tục này bằng 2 tham số : dãy ký tự 

được xuất và số" đếm các ký tự hiện diện trong dãy, lẽn tới 1K. 

Phần thân của thủ tục là 1 vòng lặp xuất các ký tự kê tiếp nhau. 

Với mỗi một ký tự, trước tiên CPU phái đợi cho tói khi thiết bị sản 

sàng, sau đó xuất ký tự ra. Các thú tục in và out điên hình sẽ là 

những thường trình hợp ngữ để đọc và ghi các thanh ghi cũa thiết 

bị được xác định bởi tham sô' đầu tiên tới hoặc từ biến được xác 
* ■ * * * 

định như là tham số thứ 2. Phép chia cho 128 loại được 7 bit thấp, 
đặt bit READY là 0. 

const size = 1023; 

type buffer = array [ 0 size ] of char\ 
procedure OutputBuf ( b : buffer ; count : integer ỉ; 

{ Xuất một khối dữ liệu đến thiết bị đầu cuối } 

var status, ỉ, ready : integer, 

begin 

for i := 0 to size do 
begin 

repeat 

ỉn ( DispỉayStatusReg, stcitus )\ 
ready ;= status div 128; 
until ready - 1; 
out ( DisplayBufferRcg, b(ij ); 

end 

end; 

Hình 5.42 Thí dụ về xuất / nhập theo chương trình 
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Bất lợi chính của xuất / nhập theo chương trình là CPU phải 
tiêu phí hầu hết thời gian vào vòng lặp đế đợi thiết bị sẵn sàng. 
Phương pháp này được gọi là đợi bận ( busy waiting ). Nếu CPU 
không phái làm điều gì khác ( thí dụ CPU trong máy giặt ), trạng 
thái đợi bận là thoái mái. Tuy nhiên, nếu CPU phải làm việc khác, 
như chạy các chương trình khác, trạng thái đợi bận là lãng phí, do 
vậy cần có một phương pháp khác. 

Phương pháp loại bỏ trạng thái đợi bận là CPU khởi động thiết 
bị I/O và bảo thiết bị I/O tạo ra ngắt khi thiết bị này xong công 
việc. Hình 5.41 cho ta thấy cách thực hiện của phương pháp này. 
Bằng cách thiết lập bit cho phép ngắt t INTERRƯPT ENABLE ) 
trong 1 thanh ghi của thiết bị, chương trình có thề yêu cầu phần 
cứng cung cấp một tín hiệu khi xuất / nhập được hoàn tất. Chúng ta 
sẽ nghiên cứu sau các chi tiết về ngắt trong chương trình này khi 
đến phần luồng điều khiển. 

Đáng lưu ý là trong nhiều máy tính, tín hiệu ngắt được tạo ra 
bằng cách AND bit INTERRUPT ENABLE với bit READY. Nếu 
phần mềm trước tiên cho phép ngắt ( trước khi khởi động I/O ), 
ngắt sẽ xáy ra tức thời bới vì bit READY sè là 1. Như vậy cần khởi 
động thiết bị trước, rồi ngay sau đó cho phép ngắt. Ghi một byte 
vào thanh ghi trạng thái không làm thay đổi bit READY, bít này 
chỉ được đọc. 

Mặc dù xuât / nhập có điều khiển ngắt ( interrupt-driven I/O ) là 
một bước tiến lớn so với xuất / nhập theo chương trình, phương 
pháp này vần không hoàn háo. Vấn đề là cần phải có một ngắt cho 
mỗi một ký tự được phát đi. Việc xứ lý ngắt lại quá tốn kém. Do đó 
cần có một phương pháp thay cho hầu hết các ngắt này. 

Giải pháp là quay trớ lại sơ đồ xuất / nhập theo chương trình 
nhưng phải có ai khác thực hiện việc xuất / nhập. Hình 5.43 trình 
bày cách sắp xếp cho giải pháp này. ở đây ta có thêm một chip 
mới, bộ điều khiển truy xuất trực tiếp bộ nhớ DMA ( direct memory 
access ) nối với hệ thống, bộ này truy xuất trực tiếp tới bus. 
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Hình 5. 43 Hệ thống có bộ điều khiến DMA. 

ị 

Terminal : đầu cuối 
Address : địa chi 
Count: số đếm 
Device : thiết bị 
Dừection : hướng 
Memory : bộ nhớ 

RS 232C controller : điều khiển RS 232C 

Chip DMA có ( ít nhất ) 4 thanh ghi bên trong, tất cá chúng đều 
được nạp bởi phần mềm chạy trên CPU. Thanh ghi đầu tiên chứa 
địa chỉ bộ nhớ được đọc hoặc ghi. Thanh ghi thứ 2 số byte ( hay từ ) 
được truyền đi. Thanh ghi thứ 3 xác định sô" của thiết bị hoặc địa 
chỉ không gian I/O sử dụng. Thanh ghi thứ 4 cho biết đừ liệu được 
đọc từ hoặc được ghi vào thiết bị I/O. 

Để ghi một khối 32 byte từ địa chỉ ô nhớ 100 tới thiết bị dầu 
cuối ( chẳng hạn thiết bị 4 ), CPU ghi các sô' 32, 100 và 4 vào 3 
thanh ghi đầu tiên của chip DMA và sau đó ghi mã của WRITE 
( chẳng hạn 1 ) vào thanh ghi sô' 4 như trình bày trong hình 5. 43. 
Ngay như được khơi động như vậy, bộ điều khiển DMA tạo ra một 
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yẻu cẩu bus đê đọc byte 100 từ bộ nhớ, theo cách CPU đọc từ bộ 
nhớ. Nếu nhận được byte này, bộ điều khiển tạo ra một yêu cầu I/O 
tới thiết bị 4, để ghi byte đó vào. Sau khi cá hai thao tác này hoàn 
tất, bộ diều khiển DMA tăng thanh ghi địa chỉ lên 1 và giảm thanh 
ghi số đếm đi 1. Nếu thanh ghi sô đếm vẫn lớn hơn 0, một byte 
khác được đọc từ bộ nhớ và sau đó ghi vào thiêt bị. 

Cuỏl cùng khi sô' đếm bằng 00, bộ điều khiến DMA chấm dứt 
việc chuyển dữ liệu và xác lập đường tín hiệu ngắt trên chip CPU. 
Với DMA, CPU chí phải khởi tạo vài thanh ghi. Sau đó, CPU tự do 
làm công việc khác cho tới khi hoàn tất thao tác chuyển dữ liệu, 
tại thời điếm CPU nhận được tín hiệu ngắt từ bộ điều khiên DMA. 
Một sô' bộ điều khiển DMA có 2 hoặc 3 hoặc nhiều tập thanh ghi, vì 
thế chúng có thể điều khiên nhiều thao tác chuyền dữ liệu đồng 
thời. 

Trong lúc DMA làm giám phần lớn gánh nặng xuất / nhập cho 
CPU, quá trình DMA không hoàn toàn tự do. Nếu thiết bị có tốc độ 
cao, như là đĩa, đang chạy bời DMA, nhiều chu kỳ bus sẽ được cần 
đề tham kháo bộ nhớ và tham khảo thiết bị. Trong suốt các chu kỳ 
này CPU phải đợi ( DMA luôn luôn có ưu tiên bus cao hơn CPU bởi 
vì thiết bị I/O thường không được phép chậm trễ ). Quá trình bộ 
điều khiến DMA lấy các chu kỳ bus từ CPU gọi là đánh cắp chu kỳ 
( cycie stealing ). Tuy nhiên, việc không phải điều khiển một ngắt 
cho mỗi byte ( hoặc từ ) có lợi rất nhiều so với sự mất mát do bị 
đánh cắp chu kỳ. DMA là một phương pháp thông thường để thực 
hiện xu át / nhập trên tât cá các máy tính cá nhân và máy tính 
mini. 

Tuy nhiên trên các máy mainirame lớn, tình huống lại khác. 
Một cách tiẻu biêu, những máy này thực hiện rất nhiều thao tác 
xuất / nhập nên việc đánh cắp chu kỳ sẽ làm bão hòa bus, và thậm 
chí chì với một tín hiệu ngắt cho một khôi dừ liệu được truyền cũng 
mất quá nhiều thời gian để điều khiển ngắt. Phương pháp thực 
hiện ớ dây là thêm các bộ xử lý I/O đặc biệt vào cấu trúc, gọi là các 
kênh dữ liệu ( data channel ), như trình bày trong hình 2. 19. 
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Một kênh thực sự là một máy tính chuyên dụng, dược cung cấp 
một chương trình để hoạt động và sau đó ngừng hoặc chạy chương 
trình mà không cần sự giúp đỡ nào từ CPU chính, Khi chương trình 
đã thực hiện xong, kênh sẽ ngắt CPU. Chương trình cùa kênh rất 
phức tạp, bao hàm cả việc chuyên nhiều khôi dữ liệu và cần ít ngắt 
hơn so với việc truyền bằng DMA đơn giản. 

Vì không có bộ vi xử lý nào cuả Intel và Motorola sử dụng các 
kênh dữ liệu, ta hãy dùng cấu trúc xuất / nhập của các mainírame 
lớn của IBM làm thí dụ. Có 2 loại kênh. Một kênh bộ chọn 
( selector channel ) dùng điều khiển các thiết bị tốc độ cao, như đĩa. 
Do tốc độ dữ liệu cao từ những thiết bị này, một kênh bộ chọn chỉ 
có thế diều khiển mồi lần một thao tác chuyến. Trái lại, một kênh 
đa hợp ( multiplexor channel ) có thể điều khiển đồng thời nhiều 
thiết bị tốc độ thấp, như là các thiết bị đầu cuối. 

Đế thực hiện xuất / nhập trên một máy vi tính có các kênh dữ 
liệu, trước tiên CPU tạo ra một chương trình cho kênh và cất vào 
trong bộ nhớ chính. Sau đó, CPU thực thi chí thị START I/O để chí 
rõ kênh và thiết bị I/O. Sau đó kênh sẽ tìm nạp địa chí chương 
trình từ một vị trí nhớ cô' định, đặt địa chỉ đó vào bộ đếm chương 
trình và bắt đầu thực hiện chương trình của kênh. Các từ nhớ khác 
nhau được minh họa trong hình 5. 44 cho một mainírame tiêu biểu. 

Chương trình của kênh bao gồm một hoặc nhiều chỉ thị 64-bit 
cho kênh. Mỗi chỉ thị chứa một opcode 8-bit cho biết thao tác vụ 
được thực hiện. Những chỉ thị này gồm READ, WRITE, READ 
BACKWARD ( thí dụ để quấn lại các băng từ ), CONTROL ( thí dụ 
để khởi động dộng cơ ), SENSE ( thí dụ kiểm tra cuòì tập tin ) và 
CONDITINAL BRANCH. Các chì thị của kênh cũng chứa một địa 
chỉ bộ đệm 24-bit cho biết nơi dữ liệu được đọc và ghi, một số đếm 
cho biết có bao nhiêu byte được chuyển và một sô' bit cờ. Các bit cờ 
xác định những yếu tô' như là không chuyển dữ liệu nào ( đây là 
phương pháp tốt đế bó qua một bản ghi trẽn báng ) và “ chấm dứt 
kênh sau khi chỉ thị này hoàn tất 

Ngoài các chỉ thị START I/O, CPU còn có vài chỉ thị xuất / nhập 
khác. 
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step 2: 

The channel 

letches Its 

program 

counter 

trom 

memory 



Hình 5. 44 Các bước tiêu biếu trong việc thực hiện xuâ't / nhập dùng các 

kênh dừ liệu. 

Bước 1 : CPU thực thi chĩ thị khới động I/O 

Bước 2 : Kênh tìm nạp bộ đếm chương trình từ bộ nhớ 

Bước 3 : Kênh thực thi chương trình và truyền dừ liệu với bộ nhớ 

Main memory : bộ nhớ chính 

Address of channel program : địa chỉ cùa chương trình của kênh 
I/O buffer : bộ đệm 1/0 
Start 1/0 : khởi động 1/0 

Ưsed to determine channel and device number : dìng để xác định kênh và 
số cúa thiết bị 

Buffer address : địa chỉ bộ đệm 

Format of a channel instruction : khuôn dạng cúa chỉ thị kênh 
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Chỉ thị HALT 1/0 bắt buộc dừng mọi hoạt động trên kênh đa 
chọn. Các chỉ thị TEST I/O và TEST CHANNEL dùng để xác định 
trạng thái hiện tại của hoạt động xuất / nhập và một vài chỉ thị I/O 
phụ khác cũng hiện diện. 

Tất cả CPU của Intel đều có các chỉ thị I/O rõ ràng để đọc hoặc 
ghi byte, từ hoặc từ dài. Các chỉ thị này chỉ rõ số của I/O port hoặc 
trực tiếp bởi một trường trongchỉ thị hoặc gián tiếp bằng cách dùng 
DX để lưu sô' của I/O port. Hơn nữa các chip DMA thường được dùng 
để giảm bớt gánh nặng xuâ't / nhập cho CPU. 

Không có chip nào của MOTOROLA có các chỉ thị I/O. Các 
thanh ghi của thiết bị I/O được địa chỉ hóa qua việc ánh xạ bộ nhớ 
( memory mapping ). ơ các chip này, DMA cũng được dùng rộng rãi. 

5.5 LUỒNG ĐIỀU KHIÊN 

Luồng diều khiển có liên quan tới trình tự thực thi các chỉ thị. 
Nhìn chung, các chỉ thị được thực hiện lần lượt được tìm nạp từ 
những vị trí nhớ liên tiếp. Các chỉ thị gọi thủ tục là nguyên nhân 
làm thay đổi luồng điều khiển, dừng thủ tục đang thực hiện hiện 
tại và bắt đầu thủ tục được gọi. Đồng thường.trình ( coroutine ) liên 
quan đến thủ tục ( procedure ) và làm cho luồng điều khiển bị thay 
đổi. Các bẫy và các ngắt cũng làm cho luồng điều khiển thay đổi 
khi có các điều kiện đặc biệt xảy ra. Tất cả các vấn đề này sẽ được 
thảo luận trong các phần sau. 

5.5.1 Luồng điều khiển tuần tự và các chỉ thị nhảy 

Đa sô' các chỉ thị không làm thay đổi luồng điều khiển. Sau khi 
một chỉ thị được thựcthi, chỉ thị tiếp theo sau trong bộ nhớ được 
tìm nạp và thực hiện. Sau mỗi một chỉ thị, bộ đêm chương trình 
được tăng bởi chiều dài của chì thị. Nếu quan sát trên một khoảng 
thời gian dài so với thời gian trung bình củachỉ thị, bộ đếm chương 
trình gần như có một hàm tuyến tính theo thời gian. Nói cách khác, 
trật tự động trong đó bộ xử lý thực sự thực hiện các chỉ thị giống 
như trật tự trong đó các chỉ thị xuất hiện theo sự liệt kê của chương 
trình, như trình bày trong hình 5. 45(a). 
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(a) (b) 

Hình 5. 45 Bộ đếm chương trình là một hàm theo thời gian ta) Không có 

chỉ thị nhảy tb) Có chỉ thị nhảy 

Nếu chương trình chứa các lệnh nhảy, mối liên hệ đơn giản này 
giừa trật tự trong đó các chỉ thị xuất hiện trong bộ nhớ và trật tự 
trong đó các chỉ thị được thực hiện không còn đúng nữa. Khi có mặt 
các chỉ thị nhảy, bộ đếm chương trình không còn là một hàm tăng 
đều theo thời gian như trình bày trong hình 5. 45(b). Kết quả là 
khó hình dung chuỗi thực thi chỉ thị từ bảng danh sách của chương 
trình. Khi người lập chương trình gặp rắc rôi trong việc theo dõi 
chuỗi chỉ thị mà bộ xử lý sẽ thực thi, họ dề gây ra lỗi. 

Sự quan sát này đã dẫn đường cho Dijkstra ( 1968 ) viết một thư 
gây tranh luận sau này có tựa đề “ GO TO Statement Considered 
Harmíul ” ( phát biểu GO TO được xem như có hại ), trong đó ông 
đề nghị nên tránh dùng phát biểu GO TO. Bức thư đó làm khai 
sinh ra cuộc cách mạng cho phương pháp lập trình có cấu trúc, một 
trong những nguyên lý của phương pháp này là thay thế phát biểu 
GO TO bằng những dạng có cấu trúc hơn của luồng điều khiển, như 
vòng lặp WHILE. 

Dĩ nhiên, những chương trình này biên dịch thành những 
chương trình cấp 2 chứa nhiều chỉ thị nhảy, bởi vì hiện thực IF, 
WHILE và những cấu trúc điều khiển cấp cao khác yêu cầu việc 
nhảy. 










Chương 5: Cấp máy qui ước 


375 



5.5.2 Thủ tục 

Kỹ thuật quan trọng nhất đối với các chương trình có cấu trúc là 
là thủ tục. Chi thị gọi thủ tục cũng làm thay đổi dòng điều khiển 
như chỉ thị nhảy nhưng không giông. Khi thực hiện xong cồng việc, 
thủ tục trả điều khiển trứ về cho phát biểu hoặc chỉ thị theo sau chỉ 
thị gọi. 

Tuy nhiên, với một cách nhìn khác, phần thân của thủ tục có 
thể được xem như xác định một chỉ thị mới ở cấp cao hơn. Từ quan 
điểm này, chỉ thị gọi thủ tục được xem như một chỉ thị đơn cho dù 
có thể rất phức tạp. Để hiểu phần mã chứa chỉ thị gọi thủ tục, điều 
duy nhât cần biết là làm gì, không cần biết cách thực hiện. 

Một loại thủ tục đáng quan tâm là thủ tục dệ qui ( recursive 
procedure ), nghĩa là, một thủ tục tự gọi chính thủ tục. Việc nghiên 
cứu các thủ tục đệ qui nhằm hiểu rõ cách hiện thực chỉ thị gọi thủ 
tục và các biến cục bộ thực sự là gì. “ Tháp Hà Nội ”, một bài toán 
cổ xưa có lời giải đơn giản liên quan đến phép đệ qui. Bài toán cần 
3 cây cọc, trên cọc đầu tiên đặt n đĩa tròn đồng tâm, đla ở trên có 
dường kính nhỏ hơn đĩa nằm ngay dưới. Cọc thứ 2 và thứ 3 lúc đầu 
được để trống. Mục tiêu là chuyền tât cả đĩa sang cọc thứ 3, lần lượt 
từng đĩa một, nhưng không được một lần nào có một đĩa lớn hơn ở 
trên đĩa nhỏ hơn. Hình 5. 46 trình bày dạng ban đầu với n = 5 
đĩa. 



Hình 5. 46 Câu hình ban đầu cho bài toán tháp Hà Nội với 5 đĩa 


Peg 1, 2, 3 : cọc 1, 2, 3 












Cấu trúc Máy tính 


rg 


Lời giải cho việc di chuyển n đĩa từ cọc 1 sang cọc 3 bao gồm 
trước tiên chuyển ( n - 1 ) đĩa từ cọc 1 sang cọc 2, sau đó chuyển 1 
đĩa từ cọc 1 sang cọc 3, sau đó chuyển ( n — ĩ ) đĩa từ cọc 2 sang cọc 
3 { xem hình 5. 47 ). Để giải bài toán ta cần 1 thủ tục chuyển n dĩa 
từ cọc i sang cọc j. Khi thủ tục này được gọi, bởi 

toivers ( n, i, j ) 

lời giải được in ra. Trước tiên thủ tục kiểm tra xem n có bằng 1 haỵ 
không. Nếu bàng 1, lời giải quá dễ dàng, chỉ việc chuyển 1 đĩa từ ỉ 
sang j. Nếu n * 1, lời giãi gồm có 3 phần như thảo luận ở trên, mỗi 
phần là một lần gọi thủ tục đệ qui. 

Lời giải dầy đu được trình bày trong hình 5. 48. Gọi 

toivers ( 3, 1, 3 ) 

để giải bài toán của hình 5. 47 phải tạo ra 3 lần gọi nữa, tức là 
towers ( 2, ĩ, 2 ) 
toiuers ( ĩ, 1, 3 ) 
towers ( 2, 2, 3 ) 

Lần gọi thứ nhât và thứ 3, mỗi lần sẽ tạo ra 3 lần gọi nữa, tổng 
cộng là 7 lần. 

Để gọi các thủ tục đệ qui, ta cần một stack chứa các tham số. 
Mỗi lần gọi một thủ tục, một khôi bộ nhớ gọi là khung stack ( stack 
írame ) dành chỗ trong stack cho các tham số, địa chỉ trở về và các 
biến cục bộ nếu có. Khung stack được tạo ra gần đây nhất là khung 
stack hiện hành. Trong thí dụ của chúng ta, stack luôn tăng theo 
chiều nghịch, từ địa chi cao tới địa chỉ thấp của bộ nhớ. Chúng ta 
chọn quy ước này bởi vì đa số các máy tính bao gồm máy của Intel 
và Motorola đều sử dụng. Do vậy cất nghĩa là lưư giữ một từ ở địa 
chỉ cho bởi coii trỏ stack, sau đó giảm con trỏ stack bằng với kích 
thước từ của từ đó. 

Ngoài con trỏ stack được dùng trò tới đỉnh của stack ( địa chỉ 
thấp nhất ), để thuận tiện nên có một con trỏ nền cục bộ LB ( local 
base pointer ) trỏ tới một vị trí cố định trong khung. 
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X 






Ffnatly move 2 dlsks / 
from peg 1 to peg 3 * 






Hình' 5.47 cần 7 bước để giải bài toán Tháp Hà Nội với 3 đĩa 
Initial State : trạng thái ban dầu 

First move 2 disks from peg 1 to peg 2 : trước tiên chuyển 2 dĩa từ cọc 1 
sang cọc 2 

Then move 1 disk from peg 1 to peg 3 : kế đến chuyển 1 đĩa từ cọc 1 sang 
cọc 3 

Finally move 2 disks from peg 2 to peg 3 : cuối cùng chuyển 2 đĩa từ cọc 2 
san? coc 3 
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procedure tovverc (n, l, Ị: tnteger); 

{Towns of Hanol 

n Is the number of dlsks 
/ is the startlng peg 
/ Is the goal peg 
fr= 6 -/-Ị Ỉ3 the other peg 

To move the n dlsks trom / to Ị ílrst check to see lf n Is 1. 

If so, the solutỉon ts Just one move. If not, decompose the problem 
Into three subprolems and solve them In sequence: 

1. Move n -1 dlsks from I to k 

2. Move I dlsk (rom / to Ị 

3. Move n -1 dlsks (rom k to J> 

var k: Integer; 

begln 

ifn=í 

then wrtteln ỰMove a dlsk from peg', i, lo peg', ]) 
eise 


begin 

ki=6-l : J; 
tovvers (n-1, /, Ảt); 
íoivers Ọ, 1,1); 
towers (n-1, k,Ị) 
end 


{compute the number o( the thlrd peg> 
{mové n • 1 dlsks (rom í to *} 

{move 1 dlsk f to Ị > 

{move n -1 dlsks (rom k to/} 


end;{tokvers} 


Hình 5.48 Thủ tục giải bài toán Tháp Hà Nội 


Hình 5. 49 trình bày khung stack cho máy có từ 16-bit. Stack 
bắt đầu ớ địa chỉ 1000 và tăng theo hướng ngược tới địa chỉ 0. Lời 
gọi toiuers ban đầu cất 71 , ỉ và j vào stack, sau dó thực thi chỉ thị 
CALL cât địa chỉ trở về vào stack ở địa chỉ 944. Trên một điểm 
nhập, thủ tục dược gọi cất giá trị cũ của LB vào stack, sau đó tăng 
con trỏ stack lên để cấp phát bộ nhớ cho các biến cục bộ. Chỉ với 
một biến cục bộ 16-bit, SP được giảm 2. Tình huô'ng sau khi các 
điều trên được thực hiện trình bày trong hình 5. 49(a). 

Trên cơ sở này ta có thể giải thích về công dụng của LB. Theo 
nguyên tắc, các biến được tham chiếu bằng cách cung cấp offset của 
chúng từ SP. Tuy nhiên, khi các từ được cất lên stack và lấy ra khỏi 
stack, những offset này sẽ thay đổi. Mặc dù trong một số trường 
hợp trình biên dịch có thế theo dõi sô" từ có trong stack và hiệu 
chỉnh các offsest, nhưng trong một sô" trường hợp có thể không 
được, và trong tất cả các trường hợp việc quản lý là cần thiết. Hơn 
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nữa, trên một sô máy như của Intel, việc truy xuâ't 1 biến ở một 
khoảng cách dã biết từ SP lại cần nhiều chỉ thị. 
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Hình 5.49 Stack ở vài điểm trong thời gian thực hiện thủ tục hình 5. 48 

Kết quả là nhiều trình biên dịch dùng một thanh ghi thứ 2, LB, 
để tham chiếu các biến cục bộ và các tham số do bởi các khoảng 
cách của chúng từ LB không bị thay đổi khi thực thi các chỉ thị cất 
và lấy ra. Trên các CPU của Intel, BP/EBP được dùng cho mục đích 
này. Trên các CPU của Motorol, bất kỳ thanh ghi địa chí nào trừ 
A7 ( con trỏ stack ) đều thực hiện được nhiệm vụ này. Thực tế các 
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tham số đều có offset dương và các biến cục bộ đều có oíĩset âm từ 
LB. Điều đầu tiên thủ tục phải thực hiện khi được gọi là cất nội 
dung trước của LB ( vì LB có thề được khôi phục lại lúc ra .khỏi thủ 
tục ), sao chép SP vào LB để tạo ra LB mởi, và tăng SP lên để 
dành chỗ cho các biến cục bộ. Mã này được gọi là phần mở đầu thủ 
tục ( procedure Prolog ). Lúc ra khỏi thủ tục, stack phải được xoá 
lần nữa, điều này dược gọi là phần kết thúc thủ tục ( procedure 
epilog ). 

Một trong những đặc tính quan trọng cúa bất kỳ máy tính nào 
là làm thê nào máy tạo ra phần mở đầu và phần kết thúc một cách 
nhanh và gọn. Nếu cả hai phần này dài và chậm, việc gọi thủ tục 
sẽ tốn kém. Những người lập. trình muôn đạt hiệu quả cao sè 
nghiên cứu đê tránh viết nhiều thủ tục ngắn, thay vào đó họ viết 
nhừng chương trình lớn, đơn điệu và không cấu trúc. Các chỉ thị 
ENTER và LEAVE của Intel, các chỉ thị LINK và ƯLNK của 
Motorola được cung cấp để thực hiện hầu hết các công việc của 
phần mở đầu và kết thúc thủ tục một cách có hiệu quả. 

Bây giờ chúng ta trở lại bài toán Tháp Hà Nội. Mỗi lần gọi thủ 
tục, một khung stack mới được thêm vào stack và mồi lần trở về 
thủ tục gọi, một khung được loại ra khỏi stack. Để minh họa việc sử 
dụng stack trong việc thực thi các thủ tục đệ qui, ta sẽ theo dõi các 
lời gọi bắt đầu bằng 

towers (3,1,3) 

Hình 5.49(a) trình bày stack ngay sau khi có lời gọi này. Trước tiên 
thủ tục kiểm tra xem n có bằng 1 hay không và phát hiện ra rằng 
n - 3, thủ tục tạo ra lời gọi 

toivers ( 2, ĩ, 2 ) 

Sau khi thực thi lời gọi này, stack dược trình bày như trong hình 
5. 49(b) và thủ tục khởi động lại tại điểm bắt đầu ( thủ tục được gọi 
luôn khởi động tại điểm bắt đầu ). Lần này việc kiểm tra n = 1 lại 
sai và có lời gọi 


toioers (1,1,3) 
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Stack lúc này như trình bày trong hình 5. 49{c) và bộ đếm chương 
trình trỏ tới nơi bắt đầu thủ tục. Lần kiểm tra này thành công 
( n = 1 ) và một dòng thông báo được in ra. Kê tiếp, thủ tục trở về 
bằng việc loại bỏ một khung stack, thiết lập lại thanh ghi LB và SP 
như hình 5. 49(d). Sau đó thủ tục tiếp tục thực hiện ở địa chỉ trờ 
về, của lần gọi thứ 2 

towers (1,1,2) 

Có thèm một khung stack mới ở lần gọi này như trình bày trong 
hình 5. 49(e). Một dòng thông báo khác được in ra; sau khi trở về 
một khung được loại bỏ khỏi stack. Các lời gọi thủ tục được tiếp tục 
theo cách này cho tới khi lời gọi ban đầu hoàn tất và khung stack 
trong hình 5. 49(a) bị loại bỏ khỏi stack. 

Các tham số có thể được truyền vào các thanh ghi hoặc stack. 
Các quy luật chúng được truyền như thê nào được gọi là chuỗi gọi 
( calling sequence ). 

5.Ỗ.3 Đổng thủ tục 

Trong chuỗi gọi thông thường, có sự phân biệt rô giữa thủ tục 
gọi và thủ tục được gọi. Xét thủ tục A gọi thủ tục B trong hình 5. 
50, 

Thủ tục B tính toán trong một khoảng thời gian và sau đó trở 
yề thủ tục A. Thoạt nhìn có lẽ ta sẽ nghĩ rằng tình huống này có 
tính đôi xứng, bởi vì cả A và B đều không phải là chương trình 
chính, chúng đều là các thủ tục. Hơn nừa, điều khiển đầu tiên được 
chuyển từ A tới B - gọi - và sau đó điều khiển được chuyển từ B tới 
A - trở về. 

Tính không đôi xứng nảy sinh từ thực tê. Khi điều khiển chuyển 
từ A tới B, thủ tục B bắt đầu được thực thi ở đầu thủ tục; khi điều 
khiển từ B trở về A, việc thực thi A không phải ở đầu thủ tục mà ở 
phát biểu theo sau lời gọi thủ tục B. Nếu A chạy thêm một khoảng 
thời gian và gọi B lần nữa, việc thực thi B lại bắt đầu ở đầu thủ 
tục B, không phải ở phát biểu theo sau lần trỏ về trước. Trong 
hướng hoạt động này, nếu A gọi B nhiều lần, B luôn luôn bắt đầu 
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lại ở đầu thủ tục mỗi lần được gọi, trái lại A không bao giờ bắt đầu 
lại từ dầu thủ tục. 


(A) 


(B> 



Calllng 

procedure 


Callẹd 

procedure 


A called from 


maln 

program 


A retums 
to main 
program 


Hình 5.50 Khi một thủ tục được gọi, việc thực hiện thủ tục luôn luôn bắt 

đầu ở phát biểu đầu tiên của thủ tục 

Calling procedure : thủ tục gọi 
Called procedure : thủ tục được gọi 

A called from main program : A được gọi từ chương trình chính 
A returns to main program : A quay về chương trình chính 
Return : quay về 
Call : gọi 
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Sự khác nhau này được phản ánh trong cách mà diều khiển 
dược chuyển giữa A và B. Khi A gọi B, A dùng chỉ thị gọi thủ tục, 
chỉ thị này đặt địa chỉ quay về ( địa chỉ của phát biểu theo sau chỉ 
thị gọi ) vào nơi nào đó thí dụ vào đỉnh của stack. Sau đó chỉ thị 
này đặt địa chỉ của B vào bộ đếm chương trình để hoàn tất việc gọi. 
Khi B trở về, B không sử dụng chỉ thị gọi mà là chỉ thị quay về, chỉ 
thị này đơn giản chỉ lấy địa chỉ trở về từ stack và đặt vào bộ đếm 
chương trình. 

Đôi khi ta có 2 thủ tục A và B, thủ tục này gọi thủ tục kia như 
là một thủ tục ( được trình bày trong hình 5. 51 ). 


<A) (B) 



Hình 5.51 Khi một đồng thủ tục bắt đầu lại, việc thực thi bắt đầu ở phát 

biểu ngay vị trí rời bỏ ở lần trước 

Khi từ B trở về A, điều khiển nhảy tới phát biểu theo sau chỉ 
thị gọi B. Khi A chuyển điều khiển tới B, điều khiển không đi tới 
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phát biểu đầu tiên của thủ tục ( trừ lần đầu tiên ) mà đi tới phát 
biểu theo sau phát biểu ” trở về ” gần nhất, nghĩa là, lần gọi A gần 
đây nhất. 2 thù tục mà trong đó thủ tục này xem thủ kia như là 
một thủ tục được gọi là các đồng thương trình ( coroutine ) hay đồng 
thu tục. 

Không có chỉ thị gọi cũng như không có chỉ thị trở về thông 
thường nào dành cho việc gọi đồng thủ tục, bởi vì địa chỉ để nhảy 
tới từ stack giống như sự trở về, nhưng không giống như chỉ thị trở 
về, chỉ thị gọi đồng thủ tục tự đặt địa chỉ trớ về vào một nơi nào đó 
cho lần trở về sau đó. Thật là tốt nếu có một chỉ thị trao đổi nội 
dung đỉnh cua stack với bộ đếm chương trình, về chi tiết, trước tiên 
chỉ thị này sẽ lấy địa chỉ trớ về cũ ra khỏi stack để đưa vào một 
thanh ghi nội tạm thời, sau đó cất bộ đếm chương trinh vào stack, 
và cuối cùng, chuyến nội dung của thanh ghi tạm vào bộ đếm 
chương trình. Khi có một từ được lấy ra khỏi stack và một từ được 
cất vào stack, nội dung con trỏ stack không thay đổi. Một chuỗi gọi 
đồng thủ tục trước tiên sẽ được khởi động bằng cách cất địa chỉ của 
một trong các đồng thủ tục vào stack. Chỉ thị gọi đồng thủ tục đôi 
khi còn gọi là resume ( bắt đầu lại ). Thực tế, chỉ thị phải tồn tại 
trên nhiều máy cấp 2 theo dạng mô tả ở đây. Tuy nhiên, thông 
thường cần có 2 hoặc 3 chỉ thị để thực hiện công việc. Hình 5. 52 
minh họa chỉ thị RESƯME. 



Step 3: 

Put saved top 
of stack in the 
program counter 


Hình 5. 52 Hoạt động của chỉ thị RESƯME. 
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Temporary register : thanh ghi tạm 

Program counter : bộ đếm chương trình 

Bước 1 : lấy đỉnh của stack đưa vào thanh ghi tạm 

Bước 2 : cất bộ đếm chương trình vào stack 

Bước 3 : đặt đỉnh của stack vào bộ đêm chương trình 
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Để có một thí dụ về việc sử dụng các đồng thủ tục, ta xét một 
chương trình quảng cáo được lập trình nâng cao cung cấp tư liệu 
chương trình tự động. Tại một nơi bất kỳ trong chương trình, người 
lập trình có thê chèn thêm một chú thích trước và sau bởi dâu #. 
Chương trình được trình biên dịch sử dụng để sinh ra chương trình 
đối tượng ( object program ). Các chú thích được hệ thống cung cấp 
tư liệu sử dụng đê tạo ra một tài liệu hướng dẫn ( manual ). Trình 
'biên dịch bỏ qua các chú thích và hệ thông cung cấp tư liệu bỏ qua 
chương trình. Đế làm bài toán thú vị này ta sẽ giả thiết rằng phần 
cung cấp tư liệu rất thông minh và phân tích ngữ pháp tất cả các 
chú thích để bảo đảm rằng không có lỗi văn phạm, bởi vì người viết 
tài liệu hướng dần lập trình dường như có khó khăn lớn với ngôn 
ngữ tiếng Anh. Một đoạn chương trình nhập mẫu được trình bày 
trong hình 5. 53. 


if seaỉs = 360 #lt the plane Is lull# 
then 
begln 

full = 1; #set a flag# 

NewPlane #request another aircratt# 
end 

else reserve (passenger)] #otherwise give this person a Seat# 


Hình 5. 53 Một đoạn chương trình với mã và tư liệu 

Chương trình quảng cáo được mô tả có thể viết thành 2 đồng 
thủ tục, một để phân tích ngữ pháp chương trình và một để phân 
tích ngừ pháp tiếng Anh. Đồng thủ tục, trình biên dịch, bắt đầu đọc 
đoạn chương trình nhập, phân tích và cuối cùng đi tới ký hiệu chú 
thích đầu tiên, #. Tại điểm này chúng muốn bỏ qua chú thích để có 
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thể tiếp tục công việc phân tích. Để bỏ qua chú thích, trình biên 
dịch gọi đồng thủ tục cung cấp tư liệu. 

Chương trình cung cấp tư liệu bắt đầũ hoạt động và phân tích 
chú thích. Cuối cùng, chương trình đi qua ký hiệu chú thích. Từ 
quan điểm đó, văn bản chương trình được bỏ qua, vì thế chương 
trình bắt đầu lại ( resume ) trình biên dịch để bỏ qua văn bản 
chương trình. Trình biên dịch sẽ được khởi động lại với tất cả các 
biến và các con trỏ nội vần còn nguyên vẹn từ điểm dừng lại, không 
phải từ điểm bắt đầu. Tại điểm này, chương trình phân tích ngữ 
pháp ( parser ) tiếng Anh có thể trong một trạng thái phức tạp; cơ 
bản là khi trình biên dịch đi tới phần kế tiếp của văn bản chương 
trình, chương trình phân tích ngữ pháp tiếng Anh được khởi động 
lại ớ trạng thái khi chương trình này bắt đầu lại ( resume ) trình 
biên dịch. 

Nên lưu ý là để thực thi đồng thủ tục ta cần phải có nhiều stack 
bởi vì mỗi đồng thủ tục cũng có thể gọi các thủ tục theo cách thông 
thường, ngoài việc tạo ra các lời gọi đồng thủ tục. 

5.5.4 Bẫy 

Bẫy ( trap ) là một loại lời gọi thủ tục tự động dược khởi động 
bởi một điều kiện nào đó do chương trình tạo ra, thường là điều 
kiện quan trọng nhưng hiếm khi xảy ra. Tràn ( overflow ) là một 
thí dụ. Trên nhiều máy tính, nếu kết quả của một phép toán sô' học 
vượt quá sô lớn nhất có thể biểu diễn, một bẫy xuất hiện, nghĩa là 
luồng điều khiển được chuyển đến một vị trí nhớ cố định nào đó 
thay vì tiếp tục theo trình tự. Tại vị trí cố định đó có một chỉ thị 
nhảy tới một thủ tục gọi là bộ điều khiển bầy ( trap handler ), bộ 
này thực hiện một động tác thích hợp nào đó, như in một thông báo 
lồi. Nếu kết của phép toán nằm trong phạm vi cho phép, bẫy không 
xuất hiện. 

Điểm cơ bản của bẫy là bẫy được khởi động bởi một điều kiện 
ngoại lệ nào đó gây ra bởi chính chương trình và được phần cứng 
hoặc vi chương trình phát hiện. Một phương pháp khác có khả năng 
điều khiển tràn là dùng một thanh ghi 1-bit được thiết lập là 1 mỗi 
khi xảy ra tràn. Người lập trình muốn kiểm tra tràn phải đưa thêm 
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vào một chỉ thị “ nhảy nếu bit tràn được thiết lập ” sau mỗi chỉ thị 
số học. Hiện thực như vậy vừa tôn không gian nhớ vừa làm cho tốc 
độ chậm lại. Bầy tiết kiệm được thời gian và bộ nhớ so với phương 
pháp kiểm tra điều khiển bởi người lập trình. Bẫy thường được thực 
hiện bằng cách có vi chương trình, vi chương trình này đơn giản chỉ 
thực hiện sự kiểm tra. 

Bẫy cũng có thể được hiện thực nhờ vào việc kiểm tra thực hiện 
bởi trình phiên dịch ở cấp 1. Nếu phát hiện thây có tràn, địa chỉ 
của bẫy được nạp vào bộ đếm chương trình. Điều này nghĩa là bẫy ở 
một cấp có thể ở dưới sự* điều khiển của chương trình ở cấp thấp 
hơn. Vi chương trình thực hiện việc kiểm tra vẫn tiết kiệm thời 
gian hơn so với việc kiểm tra của người lập trình, bởi vì việc này dễ 
dàng chồng lấp với việc khác và cũng tiết kiệm dược bộ nhớ, bởi vì 
việc này chỉ cần xảy ra ở một vài thủ tục của cấp 1, độc lập với việc 
có bao nhiêu chỉ thị số học xuất hiện trong chương trình chính. 

Một vài điều kiện thường gây ra bẫy là tràn trên dâu chấm 
dộng, tràn dưới dấu chấm động, vi phạm sự bảo vệ, opcode không 
dược xác định, tràn stack, khởi động thiết bị không có thực, tìm 
nạp một từ ở địa chỉ lẻ và chia cho zero. 

5.5.5 Ngắt 

Ngắt ( interrupt ) là những thay đổi trong luồng điều khiển gây 
ra không phải do chương trình đang được thực thi mà do bởi một 
tác động khác, thường liên quan tới I/O. Thí dụ chương trình ra 
lệnh cho đĩa khởi động truyền thông tin và thiết lập trạng thái đỉa 
dể cung cấp một ngắt ngay khi việc truyền thông tin hoàn tất. 
Giống như bẫy, ngắt cũng làm ngừng chương trình đang được thực 
thi và chuyển điều khiên tới bộ điều khiển ngắt để thực hiện một 
số động tác thích hợp. Khi hoàn tất, bộ điều khiển ngắt trả điều 
khiển cho chương trình bị ngắt. Chương trình này phải khởi động 
lại quá trình bị ngắt một cách chính xác ở trạng thái giôhg như đã 
có khi xảy ra ngắt, nghĩa là khôi phục lại tất cả các thanh ghi nội 
về trạng thái trước khi xảy ra ngắt. 

Sư khác nhau cơ bản giữa bẫy và ngắt là các bẫy đồng bộ với 
chương trình còn ngắt lại không đồng bộ. Nếu chương trình chạy lại 
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một triệu lần với cùng dữ liệu vào, bầy sẽ lại xảy ra ở cùng một nơi 
cho mỗi lần chạy, nhưng ngắt lại khác, thí dụ tùy thuộc chính xác 
lúc một người ở thiết bị đầu cuô'i âh phím CH ( carriage return ). 
Nguyên nhân đối vđi việc tái tạo lại bẫy và không tái tạo lại ngắt 
là bẫy được gây ra trực tiếp bởi chương trình, còn ngắt tốt nhất 
được gây ra gián tiếp bởi chương trtnh. 

Để xem ngắt thực sự làm việc như thế nào, ta hãy xét một thí 
dụ thông thường, một máy tính muốn xuât một dòng ký tự tới thiết 
bị đầu cuối. Phần mềm hệ thông trước tiên tập hợp tất cả các ký tự 
sẽ được ghi vào thiết bị đầu cuối trong một bộ đệm, khởi động một 
biến toàn cục ptr đê trỏ tới vị trí bắt đầu của bộ đệm và thiết lập 
biến toàn cục thứ 2 count có giá trị bằng với số ký tự được xuất. Sau 
đó chương trình kiểm tra xem thiết bị đầu cuối đã sẵn sàng chưa, 
và nếu đã sẵn sàng, xuất ký tự đầu tiên ( thí dụ bằng cách dùng các 
thanh ghi như trong hình 5.41 ). Một khi đả khởi động I/O, CPU tự 
do chạy chương trình khác hoặc thực hiện một việc khác. 

Vào thời điểm thích hợp, ký tự được thể hiện trên màn hình. 
Bây giờ ngắt có thể bắt đầu. ơ dạng đơn giản, các bước sẽ xảy ra 
như sau 

CÁC TÁC ĐỘNG PHẦN CỮNG 

1. Bộ điều khiển thiết bị xác lập một đường tín hiệu ngắt trên 
bus hệ thông để bắt đầu trình tự ngắt. 

2. Ngay khi CPU được chuẩn bị điều khiển ngắt, CPU xác lập 
một tín hiệu nhận biết ngắt ( hay trả lời ngắt ) trên bus. 

3. Khi bộ điều khiển thiết bị thấy tín hiệu ngắt đã được nhận 
biết, thiết bị đặt một số nguyên nhỏ lên các đường dữ liệu để tự 
nhận dạng. Số này được gọi là vector ngắt ( interrupt vector ) 

4. CPU loại bỏ vector ngắt ra khỏi bus và tạm thời cất di 

5. Sau đó CPU cât bộ đêm chương trình và từ trạng thái 
chương trình PSW vào stack. 

6. Sau đó CPU xác định một bộ đếm chương trình mới bằng 
cách dùng vector ngắt như là chỉ số trong một bảng ở đáy bộ nhớ. 
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Thí dụ nếu^bộ đếm chương trình có 4 byte, vector ngắt n tương ứng 
với địa chỉ 4 n. Bộ đếm chương trình mới này trỏ tới nơi bắt đầu 
một thường trình phục vụ ngắt cho thiết bị gây ra ngắt. 

CÁC TÁC ĐỘNG PHẦN MEM 

7. Điều dầu tiên thường trình phục vụ ngắt thực hiện là cất tất 
cả thanh ghi để chúng có thể được khôi phục lại sau này. Những 
thanh ghi này được cất vào stack hoặc trong một bảng hệ thông. 

8. Mỗi vector ngắt thường được tất cả thiết bị của một loại đã 
cho dùng chung, vì thế không biết thiết bị nào gây ra ngắt. Số của 
thiết bị được tìm thấy bằng cách đọc một thanh ghi của thiết bị. 

9. Bất kỳ một thông tin nào khác về ngắt, như là mã trạng 
thái, bây giờ có thể được đọc vào. 

10. Nếu có một lỗi I/O xảy ra, lỗi có thể được điều khiển ở đây 

11. Các biến toàn cục, ptr và count , được cập nhật.. Biến ptr 
được tăng dể trỏ tới byte kê tiếp và biến count bị giảm đi đế cho 
biết số byte còn lại phải xuất đã giảm đi. Nếu count vần lđn hơn 0, 
còn nhiều ký tự phải xuất. Bây giờ sự sao chép được ptr trỏ tới 
thanh ghi đệm xuất ( output buffer register ). 

12. Nếu cần, một mã đặc biệt được xuất ra để cho biết thiết bị 
hoặc bộ điều khiển ngắt được xử lý. Thí dụ chip 8259A cần có một 
tín hiệu nhận biết như vậy. 

13. Phục hồi lại tất cả thanh ghi đả cất. 

14. Thực hiện chỉ thị trở về từ ngắt ( RETƯRN FROM 
INTERRUPT ), đặt CPU trở lại chế độ va trạng thái dâ có trước 
khi xảy ra ngắt, Sau đó máy tính tiếp tục như thể là không có ngắt 
nào xảy ra. 

Khái niệm chính liên quan tới ngắt là tính trong suôt ( trans- 
pareney ). Khi xảy ra ngắt, một sô tác động được lấy và một mã 
nào đó hoạt động, nhưng khi mọi thứ đã hoàn tất, máy tính sẽ trở 
về đúng trạng thái giống như đã có trước khi xảy ra ngắt. Thường 
trình ngắt có đặc tính này được xem là trong suốt. Nếu tất cả ngắt 
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được tạo ra đều có đặc tính này, toàn bộ quá trình ngắt sẽ dễ hiểu 
hơn nhiều. 

Nếu máy tính chỉ có một thiết bị I/O, các ngắt luôn luôn làm 
việc như vừa mô tả và không còn điều gì cần nói thêm nữa. Tuy 
nhiên, một máy tính lớn thường có nhiều thiết bị I/O và một số 
thiết bị có thể hoạt động đồng thời, có khả năng thay mặt cho 
những người sử dụng khác nhau. Như vậy sè có khả năng tồn tại 
trường hợp trong khi một thường trình ngắt đang chạy, một thiết bị 
I/O thứ 2 muôn tạo ra ngắt. 

Có 2 phương pháp cho vấn đề này. Phương pháp thứ nhất là tất 
cả thường trình ngắt không cho phép các ngắt xảy ra sau. Phương 
pháp này làm cho vân đề đơn giản vì lúc đó các ngắt phải tuân theo 
một trật tự nghiêm ngặt, nhưng sẽ có vấn đề đôi với các thiết bị 
không thể chấp nhận sự chậm trễ. Thí dụ trên một đường truyền 
thông tôc độ 9600 bps, các ký tự xuất hiện sau mỗi 1042 psec, dù 
cho có sẵn sàng hay không. Nếu ký tự đầu tiên chưa được xử lý khi 
ký tự thứ 2 xuất hiện, dữ liệu sẽ bị mất. 

Khi máy tính có các thiết bị I/O thời gian tới hạn ( time - 
critical I/O device ), phương pháp thiết kế tót hơn là ấn định cho 
mỗi thiết bị một mức ưu tiên, mức cao cho thiết kế thật khẩn cấp 
và thâ'p cho thiết bị ít khẩn câ'p hơn. Tương tự, CPU cũng nên có 
các ưu tiên, tiêu biểu được xác định bởi một trường trong PSW. Khi 
thiết bị có ưu tiên n ngắt, thường trình ngắt cũng chạy ở mức ưu 
tiên n. 

Trong lúc một thường trình ngắt có ưu tiên thứ n đang chạy, 
một thiết bị có ưu tiên thập hơn muốh gây ra ngắt sẽ bị bỏ qua cho 
tới khi thường trình ngắt đó hoàn tất và CPU trở lại chạy chương 
trình của người sử dụng ( ưu tiên 0 ). Ngược lại, các ngắt từ thiết bị 
có ưu tiên cao hơn sẽ được phép và không bị một chậm trễ nào. 

Với những thường trình ngắt mà tự chúng lệ thuộc vào ngắt, 
cách tốt nhất để duy trì sự quản lý đúng là bảo đảm rằng tất cả các 
ngắt đều trong suốt. Hãy xét một thí dụ đơn giản của một hệ thông 
có nhiều ngắt. Một máy tính có 3 thiết bị I/O : một máy in, một đĩa 
và một đường RS232 với các mức ưu tiên tương ứng là 2, 4 và 5. 
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Ban đầu ( t = 0 ), chương trình của người sử dụng đang chạy, lúc t = 
10 ngắt máy in xuất hiện. Thường trình phục vụ ngắt máy in 
( ISR ) dược khỏi động, như trình bày trong hình 5.54. 
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Hình 5.54 Trình tự thời gian của thí dụ có nhiều ngắt. 

User program : chương trình của người sử dụng 

Printer interrupt priority 2 : ngắt máy in ưư tiên 2 

RS 232 interrupt priority 5 : ngắt RS 232 ưu tiên 5 

Disk interrupt priority 4 held pending : ngắt đĩa ưu tiên 4 treo 

Printer ISR : thường trình phục vụ ngắt máy in 

RS 232 ISR : thường trình phục vụ ngắt RS 232 

Disk ISR : thường trình phục vụ ngắt dĩa 

RS 232 ISR finishes disk interrupt : ISR RS 232 kết thúc, ngắt đĩa xuât 
hiện 

Printer ISR íìnishes : ISR máy in kết thúc 
Disk ISR íìnishes : ISR đĩa kết thúc 

Tại thời điểm t = 15, đường RS232 muôn gây chú ý và tạo ra 
một ngắt. Vì đường RS232 có mức ưu tiên cao ( 5 ) hơn máy in ( 2 ) 
nên ngắt xảy ra. Trạng thái của máy bây giờ đang chạy thường 
trình phục vụ ngắt máy in được cất vào stack và thường trình phục 
vụ ngắt RS232 được khởi động. 
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Sau đó một chút, tại t - 20, đĩa được hoàn tất và muôn phục vụ. 
Tuy nhiên, mức ưu tiên (4) của đĩa thấp hơn thường trình ngắt đang 
chạy hiện tại ( 5 ), nên phần cứng CPU không chấp nhận ngắt và 
treo ỡ đó. Tại t - 25, thường trình RS232 hoàn tất, vì thế máy trở 
về trạng thái đã có trước khi xảy ra ngắt của RS232, nghĩa là chạy 
thường trình phục vụ ngắt máy in ở mức ưu tiên 2. Ngay khi CPU 
chuyên sang mức ưu tiên 2, ngay trước khi một chỉ thị có thể được 
thực hiện, ngắt đĩa có ưu tiên 4 được cho phép và thường trinh phục 
vụ đĩa hoạt động. Khi thường trình này hoàn tất, thường trình máy 
in được tiếp tục. Cuối cùng, tại t - 40, tất cả thường trình phục vụ 
đã hoàn tất và chương trình của người sử dụng tiếp tục từ nơi đã 
dừng lại. 

Tất cả các chip CPU của Intel đều có 2 mức ưu tiên ngắt, che 
được ( maskable ) và không che được ( nonmaskable ). Ngắt không 
che được thường chỉ được dùng để báo hiệu những trường hợp gần 
như thảm hại, như là lỗi kiêm tra chẵn lẻ bộ nhớ. Tất cả thiết bị 
I/O đều có thể sử dụng ngắt che được. 

Khi một thiết bị I/O phát ra một ngắt, CPU dùng vectơ ngắt để 
định chỉ sô' trong một báng 256 điểm nhập để tìm địa chỉ của 
thường trình phục vụ ngắt. Trên 8088, bảng vector ngắt bắt đầu ở 
địa chỉ tuyệt đôi 0, mỗi entry có 4 byte. Trên 80286 và 80386, các 
vector ngắt là các bảng dặc tả segment 8-byte ( 8-byte segment 
descriptor ) và bảng có thể bắt đầu tại một nơi bất kỳ trong bộ nhớ. 
Một thanh ghi toàn cục trỏ tới điểm bắt đầu của bảng. 

Nếu chỉ sử dụng một mức ngắt, không có cách nào để CPU cho 
phép một thiết bị có ưu tiên cao ngắt một thường trình phục vụ 
ngắt có mức ưu tiên trung bình và ngăn cấm một thiết bị có ưu tiên 
thấp. Để giải quyết vân đề này, các CPU của Intel thường dược 
dùng cùng với bộ điều khiển ngắt 8259A ( xem hình 3.38 ). Khi 
ngắt thứ nhất xảy ra, giả sử có ưu tiên n, CPU bị ngắt. Nếu một 
ngắt kế tiếp có ưu tiên cao hơn, 8259A ngắt lần thứ 2. Nếu ngắt thứ 
2 có ưu tiên thấp hơn, ngắt này được treo ở dó cho tới khi ngắt thứ 
nhất hoàn tất. ( thường trình ngắt phải gởi một lệnh tới 8259A dể 
báo cho 8259A biết khi nào thường trình kết thúc để cho phép các 
ngắt có ưu tiên thấp hơn xảy ra ). 
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Tình huông với 680x0 của Motorola có hơi khác. Giông như 
8088, chúng có 256 vector ngắt 4-byte bắt đầu ở địa chỉ tuyệt đối 0. 
Tuy nhiên, không giống như các chip của Intel, chúng có 3 chân 
dành riêng cho sô của mức ngắt, từ 0 tới 6 cùng với ngắt sô 7 là 
ngắt không che được. Ngoài ra, CPU có một trường ưu tiên 3-bit 
trong PSW. Khi thiết bị I/O muôn gây ra một ngắt, thiết bị đặt mức 
ưu tiên lên 3 chân của chip và gởi 1 tín hiệu. Tùy thuộc vào mức ưu 
tiên hiện tại, CPU có thê chấp nhận ngắt đó hay không. Không cần 
một chip nào như 8259A. 

5.6 TÓM TẮT 


Cấp máy qui ước là cấp máy mà đa số người nghĩ đến như là 
“ ngôn ngữ máy ”. ơ cấp này máy có bộ nhớ định hướng byte hay từ 
được xếp loại từ hàng chục kilobyte tới hàng chục megabyte và các 
chỉ thị như MOVE, ADD và JUMP. 

Những máy tính hiện nay có bộ nhớ được tổ chức như là một 
chuỗi byte, với 2 hoặc 4 byte được nhóm thành từ. Bình thường cấp 
này có khoảng 8 đến 32 thanh ghi, mỗi thanh ghi chứa một từ. 
Nhiều máy tính tập hợp lại thành các họ, như họ Intel và Motorola 
đã thảo luận trong chương này. 

Thông thường các chỉ thị có một hoặc 2 toán hạng, toán hạng 
được địa chỉ hóa bằng cách dùng các kiểtt định địa chỉ tức thời, trực 
tiếp, gián tiếp, chỉ sô' hoặc các kiểu khác. Một sô' máy có nhiều kiểu 
định địa chỉ phức tạp. Các chỉ thị thường sử dụng là chuyển dừ liệu, 
phép toán nhị nguyên và đơn nguyên bao gồm phép toán sô' học và 
đại số logic, nhảy, gọi thủ tục và lạp vòng. Đôi khi các các chỉ thị 
xuất nhập. Các chỉ thị tiêu biếu chuyên 1 từ từ bộ nhớ tới thanh ghi 
( hoặc ngược lại ), cộng, trừ, nhân, chia 2 thanh ghi hoặc 1 thanh 
ghi và một từ nhớ, so sánh 2 phần tử trong các thanh ghi hoặc bộ 
nhớ. Không phải là không bình thường đối với một máy tính có 
trên 100 chỉ thị trong danh mục của chúng. 

Luồng điều khiển ở cấp 2 được thực hiện bằng cách dùng những 
chỉ thị sơ đẳng bao gồm chỉ thị nhảy, gọi thủ tục, gọi đồng thủ tục, 
bầy và ngắt. Chỉ thị nhảy được' dùng để kết thúc một chuỗi chỉ thị 
và bắt đầu một chuỗi chỉ thị mới. Các thủ tục được dùng như một cơ 
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chế trừu tượng cho phép một phần chương trình được tách thành 1 
đơn vị và được gọi từ nhiều nơi. Đồng thủ tục cho phép 2 thread 
điều khiển làm việc đồng thời. Bầy được dùng để thông báo những 
tình huống ngoại lệ, như tràn số học. Cuối cùng, các ngắt cho phép 
thiết bị I/O được tiến hành song song với sự tính toán chính, bằng 
cách cho CPU một tín hiệu ngay khi I/O hoàn tât. 
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Hình 5.9 Các thanh ghi của 80386 
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CẤP MÁY HỆ ĐIỀU HÀNH 


Các chương trước đã trình bày cách thức một trình biên dịch 
chạy trên cấp vi lập trình { cấp 1 ) thực thi các chương trình viết 
cho cấp máy qui ước ( cấp 2 ). Trên một máy tính được vi lập trình, 
các chỉ thị cua câp máy qui ước như gọi thủ tục, nhân và lập vòng 
không được thực hiện trực tiếp bằng phần cứng. Thay vào đó, chúng 
được tìm nạp, được khảo sát và được thực thi như một chuỗi các 
bước nhỏ bởi vi chương trình. Máy cấp 2 có thể được lập trình bởi 
những người không biết gì về máy câp 1 và trình phiên dịch của 
cấp này. ơ chừng mực mà chúng có liên quan, máy cấp 2 có thể 
được sử dụng như thể máy này là một phần cứng thật sự. 

Cũng như một trình phiên dịch chạy trên máy cấp 1 có thế 
phiên dịch các chương trình viết bằng ngôn ngữ máy câp 2, một 
trình phiên dịch chạy trên máy cấp 2 có thể phiên dịch các chương 
trình viết bằng ngôn ngữ máy cấp 3. Với các lý do có tính lịch sử 
( xem mục 1.3 ), trình phiên dịch chạy trên máy câ'p 2 hỗ trợ cho 
máy cấp 3 được gọi là hệ điều hành ( operating System ) như trình 
bày trong hình 6.1. Do vậy chúng ta sè gọi cấp 3 là câ'p máy hệ 
điều hành do thiếu thuật ngữ tổng quát chấp nhận được. 

Có Sự khác biệt quan trọng giữa cách mà cấp máy hệ điều hành 
được hỗ trợ với cách mà cấp máy qui ước được hồ trợ. Sự khác nhau 
này thực tế do bởi cấp máy hệ điều hành được phát triển dần dần 
ra khỏi cấp máy qui ước. Hầu hết các chỉ thị của cấp máy hệ điều 
hành cùng hiện diện ở cấp máy qui ước. Chúng ta sẽ gọi những chỉ 
thị này là các chỉ thị cấp 3 “ tầm thường “ ( ordinary ) do bởi chúng 
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bao gồm các thao tác bình thường như các phép toán sô học, logic, 
dịch bit v.v... Chúng ta cũng sẽ gọi các chỉ thị khác của máy cấp 3 
( chúng không hiện diện trong máy cấp 2 ) là các chỉ thị OSML 
( operating System machine language ) đề nhấn mạnh chúng chỉ 
hiện diện trong cấp máy hệ điều hành. 


Level 3 


Level2 


Level 1 



Hình 6.1 Các cấp 2 và 3 dều được hỗ trợ bời phần mém 

operating machine level : cấp máy hệ điều hành 
Conventional machine level xấp máy qui ước 
Microprogramming level : cấp vi lập trình 


Mặc dù ta có thể có hệ điều hanh phiên dịch tất cả các chỉ thị 
cùa cấp 3, nhưng điều này không có hiệu quá cũng như không cần 
thiết. Các chỉ thị cấp 3 tầm thường có thể được dịch trực tiếp bởi vi 
chương trình. Tình huống này được mô tả trong hình 6.2(a) cho 
trường hợp máy tính có một bộ nhớ đế lưu trữ mọi chương trình. 
Miễn là chỉ có các chỉ thị tầm thường đang được thực thi, vi chương 
trình tìm nạp các chỉ thị trực tiếp từ chương trình người sử dụng, 
khảo sát chúng và thực thi chúng. 

Tuy nhiên ngay khi gặp một chỉ thị OSML, tình huông sẽ thay 
đổi. Vi chương trình ngừng phiên dịch chương trình của người sử 
dụng và bắt đầu phiên dịch hệ điều hành. Hệ điều hành sau đó 
khảo sát chỉ thị OSML trong chương trình người sử dụng và thực 
thi chỉ thị này. Khi chỉ thị OSML đả được thực thi, hệ điều hành 
thực thi một chỉ thị nào đó làm cho vi chương trình tiếp tục tìm 
nạp và thực thi các chỉ thị của chương trình người sử dụng. Dĩ 
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nhiên nêu chỉ thị kế của chương trình người sử dụng cũng là chỉ thị 
OSML, hệ điều hành sẽ được khởi động lần nữa. 


Memory 


Memory 



User 


program 


(levẽl 3 program) 


Operating 

System 

(level 2 program) 


Microprogram 
(level 1 prõgram) 


Level 3 
-program 
counter 


Level 1 
■ program 
counter 


User 

program 

(levèl 3 program) 


Operating 

System 

(level 2 program) 


Microprogram 
(level 1 program) 


Level 3 
program 
counter 


Level 2 
program 
counter 


Level 1 
program 
coũnter 


(a) 


(b) 


Hình 6.2 (a) Các chi thị tầm thường được dịch trực tiếp bởi vi chương 
trình (b) Các chỉ thị OSML được dịch bời hệ diều hành, hệ điều hành 

được dịch bởi vi chương trình 

User program { level 3 program ) : chương trình của người sử dụng { chương 
trình cấp 3 ) 

Operating System í level 2 program ) : hệ điều hành ( chương trình cấp 2 ) 
Microprogram ( tevel 1 program ) : vi chương trình ( chương trình cấp 1 ) 
Program counter : bộ đếm chương trình 


Phương pháp thực thi các chương trình cấp 3 này có nghĩa là 
một phần thời gian máy tính có chức năng của một máy 3-cấp và 
một phần thời gian có chức năng của một máy 2-cấp. Trong khi 
thực thi một chỉ thị OSML, 3 chương trình đang chạy, mỗi chương 
trình trên mỗi máy ( ảo ). Mỗi chương trình có một trạng thái riêng 
bao gồm bộ đếm chương trình riêng. Một cách khái quát, bộ đếm 
chương trình của cáp 3 trỏ tới chỉ thị OSML, bộ đếm chương trình 
của câp 2 trỏ tới chỉ thị của hệ điều hành đang được thực thi và bộ 
đếm chương trình của cấp 1 cho biết phần cứng thực sự mà vi chỉ 
thị được thực thi. Trong chương này để đơn giản, hệ điều hành sẽ 
được nghiên cứu như một cấp đơn, điều này không có nghĩa là mọi 
hệ điều hành đều được tổ chức có một cấp. Ngược lại, một sô hệ 
điều hành nâng cao được cấu trúc thành 1 chuỗi nhiều câp. Tuy 
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nhiên chủ đề về cách thiết kế một hệ điều hành không thuộc phạm 
vi quyển sách này. Để có thêm chi tiết về các hệ điều hành có thể 
xem ( Tanenbaum, 1987 ). 

Điều cần đề cập đến là đa sô các hệ điều hành của các máy tính 
lớn đều là các hệ thống đa lập trình ( multiprogramming System ), 
nghĩa là thay vì chỉ hỗ trợ cho một máy ảo câp 3, hệ điều hành hỗ 
trợ cho vài máy ảo câp 3 chạy song song. Nếu mỗi một máy ảo được 
nối với một thiết bị đầu cuôi từ xa, ta có một hệ thông chia xẻ thời 
gian { time-shared System ). Nếu không có các thiêt bị đầu cuối từ 
xa, ta có một hệ thống đa lập trình nhóm ( batch ). Với dạng hỗn 
hợp, một sô máy ảo dang dược sử dụng trực tuyến ( on line ), một sô" 
máy khác thì không. Phần chủ yếu của hệ điều hành liên quan đến 
việc quán lý tât cả máy ảo hơn là phiên dịch các chỉ thị OSML. 

Quyển sách này chỉ có thể cung cấp ở dạng tóm tắt nhất các 
bước đầu làm quen với chủ đề hệ điều hành. Chúng ta sẽ tập trung 
vào 3 vấn đề quan trọng. Trước tiên là bộ nhớ ảo ( Virtual 
memory ), một kỷ thuật được cung cấp bởi nhiều hệ điều hành làm 
cho máy có nhiều bộ nhớ hơn là máy thật sự có. Thứ hai là xuất / 
nhập tập tin ( file I/O ), một khái niệm ở mức cao hơn các chỉ thị 
I/O mà ta đã nghiên cứu trong chương trước. Thứ ba và cuối cùng là 
xử lý song song, cách mà các quá trình ( process ) CÓ thể thực thi 
dồng thời ở cấp 3. 

Khái niệm quá trình là một khái niệm quan trọng, chúng ta sè 
mô tả chi tiết sau trong chương này. Một quá trình có thể được xem 
như một chương trình đang chạy cùng với tất cả các thông tin trạng 
thái của chương trình c bộ nhớ, các thanh ghi, bộ đếm chương trình, 
trạng thái I/O, v.v... ). 

6.1 Bộ NHỚ ẢO 

Trong những ngày đầu của máy tính, bộ nhớ có dung lượng nhỏ 
và rất đắt tiền. Máy IBM 650, máy tính khoa học hàng đầu lúc này 
( vào những năm cuối thập niên 1950 ) chỉ có bộ nhớ 2000 từ. Một 
trong những trình biên dịch viết bằng ALGOL 60 đầu tiên được viết 
cho máy tính chỉ có 1024 từ nhớ. Một hệ thống chia xẻ thời gian 
trước đây chạy rất tốt trên PDP-1 với kích thước bộ nhớ tổng cộng 




399 


Chương 6: Cấp máy hệ điều hành 

_ — — - -1 ■ - — r m . I - 



chỉ có 4096 từ 18-bit cho cả hệ điều hành và các chương trình của 
người sử dụng. Thời đó những người lập trình phải tốn nhiều thời 
gian để nén kích thước các chương trình sao cho đặt vừa trong một 
bộ nhớ nhỏ. Thông thường họ cần phải dùng một giải thuật chạy 
rất chậm hơn so với giải thuật khác, giải thuật tốt hơn, thường chỉ 
do bởi giải thuật tốt hơn sê rất lớn - nghĩa là một chương trình sử 
dụng giải thuật tốt hơn sẽ không đặt vừa trong bộ nhớ của máy 
tinh. 


Giải pháp truyền thống cho vân đề này là dùng bộ nhớ phụ, như 
đĩa chẳng hạn. Người lập trình chia chương trình thành một số 
mảng nhỏ gọi là overlay , mỗi oưerỉay có thể đặt vừa trong bộ nhớ. 
Để chạy chương trình, overlay đầu tiên được mang vào bộ nhớ và 
chạy trong một khoảng thời gian. Khi oưerlay này hoàn tất, chương 
trình đọc overlay kê tiếp và gọi overlay này và v.v... Người lập trình 
có trách nhiệm tách chương trình thành các oưerỉay, quyết định 
xem mỗi overỉay được cất ở đâu trong bộ nhớ phụ, sắp xếp việc 
chuyến các overlay giữa bộ nhớ chính và bộ nhớ phụ, và một cách 
tổng quát quản lý toàn bộ quá trình overlay mà không cần có sự 
giúp đỡ nào từ máy tính. 

Mặc dù overlay được dùng rộng rãi qua nhiều năm nhưng kỹ 
thuật này kéo theo nhiều công việc liên quan đến việc quản lý 
overlay. Vào năm 1961, một nhóm người ở Manchester nước Anh đã 
đề nghị một phương pháp thực hiện tự động quá trình oưerlay, 
người lập trình thậm chí không cần biết quá trình overlay đang xảy 
ra ( Fotheringham, 1961 ). Phương pháp này, bây giờ gọi là bộ nhớ 
ảo, rõ ràng có thuận lợi trong việc giúp cho người lặp trình thoát 
khỏi nhiều công việc kế toán phiền phức. 

Đầu tiên phương pháp này được dùng trên một số máy tính 
trong nhừng năm 1960, hầu hết đều gắn liền với những dề án 
nghiên cứu thiết kế hệ thông máy tính. Vào khoảng dầu thập niên 
1970, bộ nhớ ảo trở nên hữu dụng trên hầu hết các máy tính. Bây 
giờ thậm chí các bộ vi xử lý, kể cả 80386 và 68030 cũng như các bộ 
vi xử lý sau này đều có hệ thông bộ nhớ ảo rất phức tạp. 
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6.1.1 Phân trang 

Nhóm Manchester đâ nảy sinh ý tưởng tách riêng khái niệm về 
không gian địa chỉ và các vị trí ô nhớ ( mernory location ). Thí dụ 
xét một máy tính có một trường địa chỉ 16-bit trong các chỉ thị của 
máy này và có 4096 từ nhớ. Một chương trình trẽn máy tính này có 
thê địa chỉ hóa 65536 từ nhớ vì có 65536 ( 2 16 ) địa chỉ 16-bit. Sô" từ 
địa chỉ hóa được chỉ tùy thuộc vào sô bit có trong một địa chỉ và 
không có liên quan dừ bằng cách nào với số từ nhớ thực sự sử dụng 
được. Không gian địa chỉ ( address space ) của máy tính này bao 
gồm các sô" 0, 1, 2, 65536 bởi vì đó là tập các địa chỉ có thể có. 

Trước khi phát minh ra bộ nhớ ảo, người tá đã có sự phân biệt 
giữa các địa chỉ dưới 4096 và các địa chỉ bằng hoặc trên 4096. Mặc 
dù ít khi được phát biểu thẳng nhưng 2 phần địa chỉ này được xem 
như không gian địa chỉ có ích ( các địa chỉ trên 4095 không được 
dùng bởi vì chúng không tương ứng với các địa chỉ của bộ nhớ 
thực ). Người ta không có sự phân biệt nhiều giữa không gian địa 
chỉ và các địa chỉ của bộ nhớ thực bởi vì phần cứng bắt buộc phải có 
sự tương ứng một-một giừa chúng với nhau. 

Ý tướng tách riêng không gian địa chỉ và các địa chỉ bộ nhớ như 
sau. Bât cứ lúc nào, 4096 từ của bộ nhớ đều có thể được truy xuất 
trực tiếp nhưng chúng không cần tương ứng với các địa chỉ từ 0 tới 
4095. Thí dụ ta có thể “ bảo ” máy tính rằng từ bây giờ trở di mỗi 
khi địa chỉ 4096 dược tham chiếu, từ nhớ 0 được sử dụng. Mỗi khi 
địa chỉ 4097 được tham chiếu, từ nhớ 1 dược sử dụng; mỗi khi địa 
chỉ 8191 được tham chiêu, từ nhớ 4095 được sử dụng và v.v... Nói 
cách khác ta đã định nghĩa một ánh xạ từ không gian địa chỉ lên 
các địa chỉ bộ nhớ thực, như trình bày trong hình 6.3. 

Bằng hình \ỉẽ này, hình vẽ ánh xạ các địa chỉ từ không gian địa 
chỉ lên các vị trí bộ nhớ thực, một máy 4K thường chỉ có một ánh 
xạ cô' định giữa các địa chỉ từ 0 tới 4095 và 4096 từ của bộ nhớ, 
không có bộ nhớ ảo. Một câu hỏi thú vị là : Điều gì sẽ xảy ra nếu 
chương trình nhẩy tới một địa chỉ nằm trong khoảng 8192 và 
12287 ?. Trên máy không có bộ nhớ ảo, chương trình sẽ gây ra một 
bẫy lỗi ( error trap ) in ra một thông báo thích hợp như “ bộ nhớ 
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được tham chiếu không hiện hữu “ ( non-existent memory 
referenced ) và kết thúc chương trình. Trên máy có bộ nhớ ảo, chuỗi 
các bước sau sẽ xảy ra : 


64K 

address 
Addresses space 

0 


4096 

8191 


65535 


4K 

maln 

memory 


4095 


Hình 6.3 Một ánh xạ trong đó các địa chỉ từ 4096 tới 8191 được ánh xạ lên 
các địa chỉ bộ nhớ chính từ 0 tới 4095 

Addresses : các địa chỉ 

64K address space : không gian địa chỉ 64K 

4K main memory : bộ nhớ chính 4K 

1. Nội dung của bộ nhớ chính sẽ được cất vào bộ nhớ phụ 

2. ơác từ nhớ từ 8192 tới 12287 được đặt vào bộ nhớ phụ 

3. Các từ nhớ từ 8192 tới 12287 được nạp vào bộ nhớ chính 

4. Bản đồ địa chỉ được thay đổi để ánh xạ các địa chỉ từ 
8192 tới 12287 lên các vj trí nhớ từ 0 tói 4095 

5. Việc thực hiện tiếp tục như thế không có gì bât thường 
đả xảy ra 

Kỹ thuật overỉay tự động này được gọi là sự phân trang 
( paging ) và những chunk của chương trình được đọc vào từ bộ nhớ 
phụ được gọi lằ các trang ( page ) 
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Cũng có một phương pháp phức tạp hơn để ánh xạ các địa chỉ từ 
không gian địa chỉ lên các địa chỉ bộ nhớ thực. Để nhấn mạnh, ta 
sẽ gọi các địa chỉ mà chương trình có thể tham chiếu tới là không 
gian địa chỉ ảo ( Virtual address space ) và các địa chỉ bộ nhớ được 
nối dây ( bộ nhớ thực ) là không gian địa chỉ vật lý ( physical 
address space ). Bản dồ bộ nhớ ( memory map ) liên kết các địa chỉ 
ảo với các địa chỉ vật lý. Chúng ta cũng giả thiết rằng bộ nhớ phụ 
có đủ chỗ dể cất toàn bộ chương trình và dữ liệu của chương trình. 

Các chương trình được viết như thể có đủ bộ nhớ chính cho toàn 
bộ không gian địa chỉ ảo, cho dù không đúng như thế. Các chương 
trình có thể nạp từ hoặc cất vào bất kỳ từ nhớ nào trong không 
gian địa chỉ ảo mà không quan tâm đến thực tê là thật ra không có 
đủ bộ nhớ vật lý. Những người lập trình có thể viết các chương 
trình mà thậm chí họ không cần biết đến sự tồn tại của bộ nhớ ảo. 
Máy tính dường như có một bộ nhớ dung lượng lớn. 

Điểm này là vân đề chủ yếu và sẽ được đôi chiếu sau này với sự 
phân đoạn ( segmentation ), trong đó người lập trình phải biết đến 
sự tồn tại của các segment. Nhấn mạnh lại một lần nữa, sự phân 
trang cung cấp cho người lập trình ảo tưởng về một bộ nhớ chính 
lớn tuyến tính và liên tục có kích thước bằng với kích thước của 
không gian địa chỉ trong khi thực tế bộ nhớ chính sử dụng được có 
thể nhỏ hơn ( hoặc lớn hơn ) không gian địa chỉ. Việc mô phỏng bộ 
nhớ chính lớn này bằng cách phân trang không bị chương trình 
phát hiện ( trừ phi bị phát hiện khi đang chạy các trình kiểm tra 
định thì ) ; mỗi khi một địa chỉ được tham chiếu, chỉ thị hoặc từ dữ 
liệu thích hợp sẽ xuất hiện. Bới vì người lập trình có thể lập trình 
như thế sự phân trang không tồn tại, nên cơ chế phân trang được 
gọi là trong suốt ( transparent ). 

Ý tưởng mà người lập trình có thể sử dụng một đặc tính nào đó 
không tồn tại và không quan tâm đến cách làm việc của đặc tính 
này không phải là mới đối vởi chúng ta. Tập chỉ thị của máy. cấp 2 
không tồn tại trong ý nghĩa là không có chỉ thị nào hoàn toàn là 
chỉ thị phần cứng, nhưng tất cả chúng thực tế đều được thực hiện 
bởi phần mềm ở cấp 1. Tương tự, người lập trình ở cấp 3 có thể 
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việc. Chỉ có những người viết hệ điều hành cần phải biết bộ nhớ ảo 
làm việc như thế nào. 

6.1.2 Hiện thực phân trang 

Một yêu cầu thiết yếu đôi với bộ nhớ ảo là phải có bộ nhớ phụ 
trong đó toàn bộ chương trình được cất giữ. Khái niệm sẽ đơn giản 
hơn nếu người ta nghĩ đến bản s,ao của chương trình trong bộ nhớ 
phụ như là một bản gốc và các mảng của chương trình được mang 
vào bộ nhớ chính ở nhừng thời điểm khác nhau như là những bản 
sao. Tất nhiên, điều quan trọng là giữ bản cập nhật ban đầu. Khi có 
những thay đổi trong bản sao ở bộ nhớ chính, chúng cũng phải được 
phản ánh vào bản gốc. 

Không gian địa chỉ ảo được tách ra thành nhiều trang có kích 
thước bằng nhau. Thông thường hiện nay mỗi trang có kích thước 
nằm trong khoảng từ 512 tới 4096 địa chỉ. Kích thước trang luôn 
luôn là lũy thừa của 2. Không gian địa chỉ vật lý được tách thành 
nhiều mảng cũng theo cách tương tự, mỗi mảng có kích thước bằng 
với kích thước trang sao cho mỗi mảng của bộ nhớ chính có khả 
năng lưu giữ đúng một trang. Các mảng cua bộ nhớ chính này mà 
các trang được cất vào gọi là các khung trang ( page írame ). Trong 
hình 6.3 bộ nhớ chính chỉ chứa một khung trang. Trong các thiết kế 
thực tế bộ nhớ chính sẽ chứa hàng chục, hàng trăm hoặc thậm chí 
hàng ngàn khung trang trong một máy lớn. 

Hình 6.4 minh họa một phương pháp khả thi phân chia một 
không gian địa chỉ 64K. Bộ nhớ ảo của hình 6.4 sẽ được thực hiện ở 
máy cấp 2 nhờ vào một bảng trang ( page table ) 16-từ. Khi chương 
trình muôn tham chiếu bộ nhớ hoặc tìm nạp dữ liệu, cất dữ liệu, 
tìm nạp chỉ thị hoặc nhảy, trước tiên chương trình sè tạo ra một 
địa chỉ 16-bit tương ứng với một địa chỉ ảo giừa 0 và 65535. Có thể 
dùng địa chỉ chỉ sô', địa chỉ gián tiếp và mọi kỹ thuật thông dụng để 
tạo ra địa chỉ này. 

Trong thí dụ này địa chỉ 16-bit gồm có số của trang ảo ( Virtual 
page number ) 4-bit và địa chỉ 12-bit trong trang được chọn như 
trình bày trong hình 6.5(a). Trong hình vẽ này địa chỉ 16-bit là 
12310, được xem như địa chỉ 22 của trang 3. Mối quan hệ giữa các 
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trang và các địa chỉ ảo cho thí dụ này được trình bày trong hình 
6.5(b). Nếu địa chỉ ảo 0 của trang 3 ở địa chỉ vật lý là 12288, địa 
chỉ ảo 22 phải ớ địa chí vật lý 12310. 


64K Virtual address space 


Virtual 

address 


0 

4096 - 

8102- 

12288 

16384 

20480 

24576- 

28672 

32768 

36864 


40960 

45056- 

49152 

53248- 

57344 


61140- 


!-► 

Page 0 ! 


Page 1 

1^ 

Page 2 


Page 3 


Page 4 


Page 5 


Page 6 


Page 7 


Page 8 


Page 9 


Page 10 


Page 11 


Page12 


Page13 


Page14 


Page 15 


} 


4K 


32K maln memory 


Main memory 
address 

0 — 

4096 — 


8102 

12288- 

16384- 


20480 

24576- 


28672-► 


Page trame 0 


Page trame 1 


Page írame 2 


Page ĩrame 3 


Page frame 4 


Page írame 5 


Page trame 6 


Page trame 7 


(b) 


} 


4K 


(a) 


Hình 6.4 (a) Không gian địa chỉ 64 K được chia thành 16 trang 4K (b) 
Bộ nhớ chính 32K được chia thành 8 khung trang 4K 

64 K Virtual address space : không gian địa chỉ ảo 64K 
Virtual address : địa chi áo 
32K main memory : bộ nhớ chính 32K 
Main memory address : địa chỉ bộ nhớ chính 

Khi phát hiện cần trang ảo thứ 3, hệ điều hành phải tìm ra nơi 
định vị của trang 3. Có 9 khả năng : 8 khung trang trong bộ nhớ 
chính hoặc một nơi nào đồ trong bộ nhớ phụ bởi vì không phải tất 
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cả trang ảo đ£u ở trong bộ nhớ chính. Để tìm ra khả năng nào 
trong 9 khả năng, hệ điều hành phải xem xét trong bảng trang, ở 
bảng này có một điểm nhập cho mỗi một trang của 16 trang ảo. 


-16-Btt Virtual ađdress-► 


r°l 

pn 

m 

FF 

0 

0 

0 

0 

0 0 


o ' 

© 


4 btt Virtual 12-bit address 

page number = 3 vvlthin the selected 

Virtual pagẽ = 22 


<a) 


Page 

Virtual address 

0 

0 - 4095 

1 

4096 - 9191 

2 

B192-12267 

3 

12288-163B3 

4 

16384 - 20479 

5 

20480 - 24575 

6 

24576 - 28671 

7 

28672 - 32767 

8 

32768 - 36863 

9 

36864 - 40959 

10 

40960 - 45055 

11 

45056 - 49151 

12 , 

49152-53247 

13 

53248 - 57343 

14 

57344 • 61439 

15 

61440 - 65535 


(b) 


'Hình 6.5 (a) Một địa chỉ áo bao gồm số cua trang ẩo 4-bit và offset 12-bit 
(b) Các số của trang và các địa chỉ ảo của chúng 
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16-bit Virtual address : địa chỉ ảo 16-bit 
4-bit Virtual page number : sô* của trang ảo 4-bit 

12-bit address within the selected Virtual page : địa chĩ 12-bit trong trang 
áo dược chọn 
Page : trang 

Virtual address : địa chí áo 


Page 

tabíe 


Page 0 

Page 1 

Page 2 

Page 3 

Page 4 

Page 5 

Page 6 

Page 7 

Page 8 

Page 9 

Page 10 

Paga 11 

Page 12 

Page 13 

Page 14 

Page 15 


Secondary 
memory Page 
address frame 


1 I 0011011011 o7 


110 


lf page is in main memory, 
if page Is not in main memory 


(b) 


(a) 


Hình 6.6 (a) Bảng trang phái chứa các điếm nhập nhiều bằng các trang 
áo (b) Bảng trang thí dụ có 3 trường cho mỗi điểm nhập : 1 bit hiện diện / 

vắng mặt, địa chỉ đĩa và số của khung trang 

Page table : báng trang 

Secondary memory address : địa chỉ bộ nhớ phụ 
Page frame : khung trang 

1 if page is in main memory : 1 nếu trang ở trong bộ nhớ chính 
0 if page is not in main memory : 1 nếu trang không ở trong bộ nhớ chính 






















Chương 6: Cấp máy hệ điều hành 


407 


íjM 


Bảng trang thí dự của hình 6.6 có 3 trường. Trường đầu tiên có 
1 bit sẽ bằng 0 nếu trang không ỡ trong bộ nhớ chính và bằng 1 
nếu trang ở trong bộ nhớ chính. 

Trường thứ 2 cho biết địa chỉ ớ đó trang ảo được cất trong bộ 
nhớ phụ ( thí dụ track và sector của đĩa ) khi trang không ở trong 
bộ nhớ chính. Địa chi được cần đen đê trang được.tìm thây và được 
mang vào bộ nhớ khi cần thiết, sau này được trả về vị trí ban đầu 
cúa trang trong bộ nhớ phụ khi khỏng còn cẩn đến nữa trong bộ 
nhớ chính. 

Trường thứ 3 là một trường 3-bit cho biết khung trang ớ đó 
trang được định vị nếu trang ờ trong bộ nhớ chính. Nếu trang 
không ờ trong bộ nhớ chính, trường thứ 3 không có ý nghĩa nén 
được bỏ qua. 

Giả thiết rằng trang áo ờ trong bộ nhớ chính, trường khung 
trang 3-bit sẽ cho biết trang ớ đâu. Sô cùa khung trang được đưa 
vào 3 bit cực trái của thanh ghi MAR, và địa chỉ trong trang áo, 12 
bit cực phải cưa địa chỉ gốc được đưa vào 12 bit cực phải cùa thanh 
ghi MAR. Theo cách này địa chi cùa bộ nhớ chính có thể được hình 
thành như trình bày trong hình 6.7. Khung trang 3-bit cộng với 
offset 12-bit cho địa chi 15-bit, địa chỉ này cần cho bộ nhớ chính 
32K của hình 6.4. Phần cứng sử dụng địa chí này và tìm nạp từ 
mong muôn trong thanh ghi MBR hoặc có thể cất MBR vào từ mong 
muốn. 

Hình 6.8 trình bày một ánh xạ có thể có giừa các trang ảo và 
các khung trang vật lý. Trang ảo 0 ở trong khung trang 1. Trang ảo 
1 ở trong khung trang 0. Trang ảo 2 không ở trong bộ nhớ chính. 
Trang áo 3 ớ trong khung trang 2. Trang ảo 4 không ỡ trong bộ nhớ 
chính. Trang ảo 5 ở trong khung trang 6 và v.v... 

Nếu hệ điều hành phải đối mọi địa chỉ ẩo của chỉ thị máy cấp 3 
thành một địa chỉ thực, một máy cấp 3 có bộ nhớ ảo sẽ chạy chậm 
hơn nhiều lần so với máy không có bộ nhớ ảo và toàn bộ ý tướng về 
bộ nhớ ảo sè là không thực tế. Để tăng tốc độ phiên dịch từ địa chỉ 
ảo thành địa chỉ vật lý, bảng trang ( page table ) thường được duy 
trì trong các thanh ghi phần cứng đặc biệt và phép biến đổi từ địa 
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chỉ ảo thành địa chỉ vật lý được thực hiện trực tiếp bằng phần 
cứng. Một phương pháp thực hiện khác là giữ bản đồ trong các 
thanh ghi nhanh và để vi chương trình thực hiện phép biến đổi bởi 
việc lập trình rõ ràng. Tùy thuộc vào câu trúc của cấp vi lập trình, 
việc có vi chương trình thực hiện phép biến đổi hầu như nhanh 
bằng việc thực hiện phép biến đổi trực tiếp bằng phần cứng và sẽ 
không yêu cầu những mạch điện đặc biệt hoặc sự thay đổi nào về 
phần cứng. 


* 16-btt Virtual address-► 

I 0 1 0 I 1 Ị TJ o|o|o|o[o|o|o|iỊo|iM ĩõ~| 



Hình 6.7 Hình thành địa chí bộ nhớ chính từ một địa chỉ ảo 

16-bit Virtual address : địa chỉ áo 16-bit 
Virtual page 3 : trang ào 3 

Address within Virtual page 3 ; địa chỉ trong trang ảo 3 
Page frame : khung trang 
Page table : bảng trang 

15-bit main memory address : địa chỉ 15-bit của bộ nhớ chính 
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Page table 


Virtual Page Page 

page frame Main memory trame 



0 

1 

2 

3 

4 

5 

6 
7 


Hình 6.8 Một ánh xạ của không gian dịa chí có 16 trang trên một bộ nhớ 

chính có 8 khung trang 


Page table : bảng trang 
Virtual page : trang ảo 
Page frame : khung trang 
Main memory : bộ nhớ chính 
Page frame : khung trang 

1 = present in main memory : 1 = hiện diện trong bộ nhơ chinh 
0 = not present in main memory : 0 = không hiện diện trong bộ nhớ chính 
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6.1.3 Phân trang theo yêu cầu và mô hình của tập vận hành 

Trong phần tháo luận trước ta đà giá thiết rằng trang ảo được 
tham chiếu ớ trong bộ nhớ chính. Tuy nhiên, giả thiết này khống 
luỏn luỏxi đúng bới vì bộ nhớ chính không có dử chồ cho tất cả các 
trang ao. Khi có tham chiếu tới một địa chỉ trẽn một trang không 
hiện diện trong bộ nhớ vật lý, ta sẽ có một lỗi trang. Sau khi có 1 
lỗi trang xuât hiện, hệ điều hành cần phải đọc trong trang được yêu 
cáu từ bộ nhớ phụ, đưa vào vị trí bộ nhớ vật lý mới trong bảng 
trang và sau đó lập lại chi thị dã gáy ra lồi. 

Có thế khới động một chương trình chạy trên một máy có bộ 
nhó' ảo ngay khi khòng có chương trình nào trong bộ nhớ chính. 
Báng trang hiếm khi phải được thiết lập đế chỉ rõ từng hoặc mọi 
trang áo trong bộ nhớ phụ và không ỡ trong bộ nhớ chính. Khi 
CPU tìm nạp chi thị đầu tiên, tức thời CPU nhận được một lỗi 
trang làm cho trang chứa chi thị dẩu tiên dược nạp và dưa vào bảng 
trang. Sau đó chí thị đầu tiên có thế bắt đầu. Nếu chỉ thị đầu tiên 
có 2 dịa chì, với 2 địa chỉ ớ trẽn các trang khác nhau, cả 2 khác với 
trang của chi thị, 2 lỗi trang sè xuất hiện và 2 trang nữa sè được 
mang vào trước khi chí thị có thê thực thi. Chi thị kê tiếp cũng có 
thê gây ra nhiều lỗi trang hơn và v.v... 

Phương pháp vặn hành bộ nhớ ao này dược gọi là phân trang 
theo yêu cầu ( demand paging ). Trong phân trang theo yêu cầu, các 
trang được mang vào chi khi thực sự có một yêu cầu trang, không 
dược mang vào trước. 

Vân đê phân trang theo yêu cầu dù có được sử dụng hay không 
cũng chi thích hợp khi chương trình khời động lần đầu. Khi chương 
trình đã chạy được một lúc, những trang cần thiết đã được tập hợp 
sẵn trong bộ nhớ chính. Nếu máy tính là máy chia xẻ thời gian và 
những người sứ dụng được tráo đổi sau khi máy chạy được 100 msec 
hoặc khoáng chừng đó, mồi chương trình sẽ được khởi động lại 
nhiều lần trong suốt quá trình hoạt động. Bởi vì bản đồ bộ nhớ là 
duy nhất cho từng chương trình và bị thay đổi khi các chương trình 
bị chuyển đổi, trong hệ thống chia xẻ thời gian vấn đề này đã trở 
nên quan trọng. 
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Một phương pháp khác dựá trên sự quan sát là hầu hết các 
chương trình không tham chiếu không gian địa chỉ của chúng một 
cách giống nhau mà các tham chiếu có khuynh hướng tập trung 
trên một ít trang. Một tham chiếu bộ nhớ có thể tìm nạp một chỉ 
thị, có thể tìm nạp một dữ liệu hoặc có thế cất dử liệu. Tại một thời 
diểm bất kỳ t tồn tại một tập gồm tất cả các trang được sử dụng bới 
k tham chiếu gần nhất. Denning ( 1968 ) đã gọi tập này là tập 
vận hành ( working set ) w(k, t). Bởi vì ( k+1 ) tham chiếu gần nhất 
phải sử dụng tất cả các trang đã sử dụng bới k lần tham chiếu gần 
đây nhất, và có thể là những tham chiếu khác, ivik, t) là một hàm 
không giảm đơn điệu ( monotonically ) theo k. Giới hạn của w{k, t) 
khi k trở nên lớn là vô hạn bơi vì chương trình không thề tham 
chiếu nhiều trang hơn không gian địa chỉ cũa chương trình chứa, và 
ít chương trình sẽ sử dụng mọi trang đơn. 

Hình 6.9 miêu tả kích thước của tập vận hành như là một hàm 
theo k . Thực tế đa sô" các chương trình đều truy xuất ngẫu nhiên 
một sô" ít trang, tập vận hành này thay đối chậm theo thời gian 
giải thích sự gia tăng nhanh ban đầu của đường cong và sau đó tăng 
chậm lại khi k lớn. Thí dụ một chương trình đang thực thi một 
vòng lặp chiếm 2 trang, việc sử dụng dữ liệu chiêm 4 trang, có thê 
tham chiếu tất cá 6 trang mỗi một ngàn chỉ thị, nhưng tham chiếu 
gần nhất tới một trang nào khác có thể có một triệu lần tham chiêu 
trước đó, trong thời gian pha khởi động. Do hành vi tiệm cận này, 
các nội dung cua tập vận hành không thay đồi nhanh theo giá trị k 
đã chọn, tồn tại một tầm rộng các giá trị của k mà tập vận hành 
không thay đổi. 

Bởi vì tập vận hành thay đối chậm theo thời gian, ta có thế tạo 
ra một dự đoạn hợp lý như sẽ cần đên những trang nào khi chương 
trình dược khởi dộng lại dựa trên nền tảng của tập vận hành khi 
chương trình vừa mới ngưng hoạt động. Những trang này sau đó có 
thế được nạp trước, trước khi khởi động chương trình. 

Lập luận ủng hộ cho việc đưa tập vận hành vào bộ nhớ chính 
trước là tập này có thể được dưa vào trong lúc một chương trình 
khác đang chạy. Khi một chương trình được khởi động, chương 
trình sẽ không tức thời tạo ra nhiều lỗi trang lãng phí thời gian, 
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một sự kiện làm cho CPU ở trạng thái nghỉ trong lúc các trang cần 
đến đang được đưa vào. Nên nhớ rằng thời gian cần thiết để đọc 
một trang từ đĩa tiêu biếu dài gấp 20000 lần thời gian đọc một chỉ 
thị hoặc hơn nữa. 



Hình 6.9 Tập vận hành là tập các trang được sử dụng bời k tham chiếu bộ 
nhớ gần nhất. Hàm U)(k, t) là kieh thước của tập vận hành tại thời điểm í 

Size of w(k t t) : kích thước của w(k, t) 

Lập luận chống lại việc đưa tập vận hành vào bộ nhớ chính 
trước là nếu chương trình đang ở trong lúc giao thời' giữa tập vận 
hành này và một tập vận hành khác và chưa được ổn định, nhiều 
công việc sẽ được thực hiện mang vào các trang sè không được 
tham chiêu tới. Tình huông này không thể xảy ra với phương pháp 
phân trang theo yêu cầu. Chỉ có các trang được nạp là những trang 
thực sự được cần đến. Nhừng đặc tính tốt tương đối của 2 phương 
pháp này vẫn đang được tranh luận. 

6.1.4 Chính sách thay thế trang 

Cho tới đây ta vần ngầm giả thiết rằng luôn có một khung 
trang trống dùng để nạp trang mới vào. Điều này sẽ không đúng 
trong trường hợp tổng quát và ta sẽ phẩi loại bổ một số trang 
( nghĩa là chép các trang trở lại vào bộ nhớ phụ ) để tạo chỗ trống. 
Như vậy cần có một giải thuật quyết định sè loại bỏ trang nào. 

Việc chọn ngẫu nhiên một trang để loại bỏ chắc chắn không 
phải là một ý tưởng hay. Nếu trang chứa chỉ thị sắp xuất hiện bị 
lấy đi, một lỗi trang khác sẽ xảy ra ngay khi tìm nạp chỉ thị kế 
tiếp. Đa số các hệ điều hành đều phải đoán trưđc những trang nào 
trong bộ nhớ ít được dùng nhất theo nghĩa sự vắng mặt của chúng 
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ít CÓ ảnh hưởng có hại nhất tới chương trình đang chạy. Một cách 
để thực hiện là dự đoán khi nào tham chiếu kế tiếp tới từng trang 
sẽ xảy ra và loại bỏ trang dự đoán được tham chiếu kê tiếp ở xa 
nhất trong tương lai. Nói cách khác, thử chọn một trang mà trang 
này sè không được cần đến trong một thời gian dài, chứ không phải 
bỏ một trang mà chẳng mây chốc nữa trang này sẽ được cần đến. 

Một giải thuật phổ biến là loại bỏ trang ít được dùng gần nhất 
bởi vì xác suất trang đó không ở trong tập vận hành hiện tại cao. 
Phương pháp này dược gọi là ít được dùng gần đây nhất ( least 
recently used ) hoặc giải thuật LRƯ. Mặc dù giải thuật này thường 
thực hiện tô't nhưng cũng có những tình huống không hợp lý như 
được mô tả dưới đây, giải thuật LRU hoàn toàn sai. 

Hãy hlnh dung một chương trình thực thi một vòng lặp lớn mở 
rộng đến 9 trang ảo trên một máy chỉ có chỗ cho 8 trang trong bộ 
nhớ. Sau khi chương trình lấy đến trang 7 bộ nhớ chính sẽ được 
trình bày như trong hình 6.10(a). Cuối cùng khi tìm nạp một chỉ thị 
từ trang ảo 8, lỗi trang xảy ra. Quyết định trang nào sẽ bị loại bỏ 
phải được thực hiện. Giải thuật LRƯ sẽ chọn trang ảo 0, bởi vì 
trang này ít được dùng gần đây nhất. Trang ảo 0 bị loại bỏ và trang 
ảo 8 được đưa vào để thay thế, như trong hình 6.10(b). 

Sau khi thực thi chỉ thị trên trang ảo 8, chương trình nhảy trở 
lại đỉnh của vòng lặp, tới trang ảo 0. Bước này gây ra một lỗi trang 
khác. Trang ảo 0 vừa mới bị bỏ đi phải được đưa vào trở lại. Giải 
thuật LRƯ chọn trang 1 để bỏ đi và sinh ra tình huống như trong 
hình 6.10(c). Chương trình tiếp tục trên trang 0 một thời gian ngắn, 
sau đó tìm nạp chỉ thị từ trang ảo 1, gây ra một lỗi trang. Trang 1 
phải được đưa vào trở lại và trang 2 bị bỏ đi. 

ở đây giải thuật LRƯ rõ ràng lúc nào cũng tạo ra một chọn lựa 
xấu nhất. Tuy nhiên, nếu bộ nhớ chính có thể vượt quá kích thước 
của tập vận hành, giải thuật toán LRƯ có khuynh hướng giảm tôi 
thiểu sô' lỗi trang. 
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Virtual page 8 
Virtual page 1 
Virtual page 2 
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(b) 

Hình 6.10 Sự thất bại cùa giãi thuật LRƯ 

m 

Một giải thuật khác là vào trước ra trước ( fìrst-in first-out ) 
hoặc FIFO. FIFO loại bỏ trang đã nạp ít gần đây nhất, độc lập với 
lúc trang này được tham chiếu lần cuối. Kết hợp với mồi khung 
trang là bộ đếm, có thể được giữ trong bảng trang. Ban đầu tất cả 
bộ đếm được thiết lập bằng 0, Sau mỗi lần xử lý lỗi trang, bộ đếm 
của từng trang có trong bộ nhớ được tăng 1 và bộ dấm của trang 
vừa được đưa vào được thiết lập bằng 0. Khi cần phải chọn trang để 
loại bỏ, bộ đếm của trang nào cao nhất trang đó sẽ được chọn. Bộ 
dêm của trang cao nhất nói lên sô lỗi trang cao nhất. Điều này có 
nghĩa là trang này được nạp vào bộ nhớ trước bât kỳ một trang nào 
khác trong bộ nhớ và như vậy có cơ hội lớn nhất không còn được 
cần đến nữa. 

Nêu tập vận hành lớn hơn sô khung trang có thể sử dụng, 
không có giải thuật nào cho kết quả tốt và lồi trang sẽ thường 
xuyên xảy ra. Một chương trình thường xuyên và liên tục tạo ra lỗi 
trang được gọi là thrashing. Khỏi phải nói, thrashing là đặc tính 
không mong muốn có trong hệ thôhg. Nếu một chương trình sử 
dụng một không gian địa chỉ ảo rất Iđn nhưng có tập vận hành 
nhỏ, thay đổi chậm đặt vừa trong bộ nhớ chính có thể sử dụng, 
chương trình sẽ cho ít rắc rô'i cho dù có vượt quá thời gian tồn tại 
của chương trình, chương trình sử dụng hàng trăm lần nhiều từ của 
bộ nhớ ảo cũng như máy có các từ trong bộ nhớ chính, 

Nếu một trang nào đó bị bỏ đi vần không bị thay đổi từ khi 
trang được đọc ( sự cô' có thể xẩy ra nếu trang đó chứa chương trình 
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chứ không phải dữ liệu ), không cần thiết phải ghi lại trang vào bộ 
nhớ phụ bởi vì đã có một bản sao đúng ở trong đó. Nếu trang bị 
thay đổi từ khi được đọc, bản sao trong bộ nhớ phụ không còn đúng 
nữa và trang phải được ghi lại. 

Nếu có một phương pháp cho biết trang không bị thay đối từ khi 
được đọc vào ( trang sạch ) hoặc trang đã được chứa vào ( trang 
dơ ), ta có thề tránh được mọi việc ghi lại các trang sạch, như vậy 
tiết kiệm được nhiều thời gian. Một sô' máy tính có 1 bit cho mỗi 
trang trong báng trang, bit này được thiết lập bằng 0 khi một trang 
được nạp và được thiết lập bằng 1 mỗi khi trang được chứa vào, 
việc thiết lập dược thực hiện bởi vi chương trình hoặc phần cứng. 
Bằng cách kiểm tra bit này hệ điều hành có thể nhận ra trang dơ 
hay trang sạch và do dó biết được trang đó có cần phải ghi lại hay 
không. Một bit như vậy đôi khi dược gọi là bit dơ ( dirty bit ). 

R5 ràng ta muốn duy trì một tỉ lệ cao giữa số trang sạch và 
trang dơ để tôi thiểu hóa khả năng cần phải ghi lại ở lỗi trang kê 
tiếp. Gần như trên tất cả máy tính, trang có thề được chép từ bộ 
nhớ chính vào bộ nhớ phụ trong thời gian CPU tính toán bằng cách 
dùng DMA hoặc các kênh dữ liệu. Một sô hệ diều hành khai thác 
lợi thế của cơ chế song song này mồi khi đĩa nghi bằng cách lấy 
một trang dơ và phát ra một lệnh sao chép trang lên đĩa. Dĩ nhiên 
việc sao chép trang lên đĩa không làm thay dổi hoặc phá húy bản 
sao trong bộ nhớ chính. 

Nếu trang được làm dơ lần nữa ngay sau quá trình sao chép 
hoặc ngay trong thời gian đó, việc sao chép đã được thực hiện là vô 
ích nhưng bởi vì dù sao đĩa cũng ở trạng thái nghĩ và CPU được tự 
do tính toán lại ngay khi CPU phát ra lệnh điều khiển dĩa, giá của 
việc sao chép không cao. Việc ghi lên đĩa được thực hiện với ý định 
làm sạch những trang dơ được gọi là ghi lén ( sneaky write ). 

6.1.5 Kích thước trang và sự phân mảnh 

Nếu chương trình và dữ liệu của người sử dụng tình cờ có kích 
thước bằng đúng một sô nguyên các trang, ta không có khoảng 
trống bị bỏ phí khi chúng ở trong bộ nhớ. Trái lại, nếu kích thước 
không bằng đúng một số nguyên các trang, ta sẽ có khoảng trống 
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nào đó không dùng đến trên trang cuối. Thí dụ nếu chương trinh và 
dữ liệu cần 26000 từ trên một máy có 4096 từ mỗi trang, 6 trang 
đầu tiên sẽ đầy, tổng cộng là 6 X 4096 = 24576 từ và trang cuối 
cùng sẽ chứa 26000 - 24576 = 1424 từ. Vì mỗi trang có thể chứa 
4096 từ, nên có 2672 từ sẽ bị bỏ phí. Mỗi khi trang thứ 7 có mặt 
trong bộ nhớ, các từ này sẽ chiêm chỗ bộ nhớ chính nhưng không 
có nhiệm vụ hữu dụng. Vân đề của các từ bị bỏ phí này được gọi là 
sự phân mảnh ( íragmentation ). 

Nếu kích thước trang là n từ, lượng khoảng trống trung bình bị 
tiêu phí trong trang cuối cùng của một chương trình do sự phân 
mánh sẽ là n!2 từ, một tình huống gợi ý việc sứ dụng kích thước 
trang nhỏ để giám thiểu sự bó phí này. Mặt khác, kích thước trang 
nhỏ nghĩa là sẽ có nhiều trang cũng như phải có một bảng trang 
lớn. Nếu bảng trang được duy trì trong phần cứng, bảng trang lớn 
có nghĩa là cần có nhiều thanh ghi hơn để chứa bảng/trang, do đó 
sẽ làm tăng giá thành của máy tính. Ngoài ra, sẽ ợần nhiều thời 
gian đề nạp và cất các thanh ghi này mỗi khi một chương trình 
được khởi động hoặc dừng. / 

Hơn nữa, các trang nhỏ làm cho việc sử dụng bọ nhớ phụ có các 
thời gian truy xuất dài, như là đĩa, không có hiệ|íi quả. Do sẽ phải 
chờ 10 msec hoặc hơn trước khi bắt đầu chuyển/ dữ liệu, người ta 
muôn chuyển một khôi thông tin lớn bởi vì thời gian chuyển dữ liệu 
thường ngắn hơn thời gian tìm kiếm kết hợp, cộứg với thời gian trì 
hoãn do tác động quay đĩa. Nhìn chung, tốn th^m một ít thời gian 
phụ đế đọc 1024 từ sẽ tôt hơn để chỉ đọc 256 ti'. Mặt khác, nếu bộ 
nhớ phụ không có thời gian trì hoãn do tác độiig quay đĩa, như bộ 
nhớ bán dẫn hay lõi từ có tốc độ thâp, thời gian chuyển dữ liệu 
tổng cộng tỉ lệ với kích thước khối dừ liệu. 

Các trang nhỏ có lợi điểm là nêu tập vận hành bao gồm rất 
nhiều vùng nhỏ riêng biệt trong không gian bộ nhớ ảo, có thể có ít 
thrashỉng với kích thước trang nhỏ so với kích thứớc trang lớn. Thí 
dụ ta khảo sát một chương trình truy xuất ngẫu nhiên 20 vùng 
phân biệt với mỗi vùng có 100 từ. Nếu cất vào một ma trận A 
1000 X 20 với A[l,l], A[2,l], A[3,l] và v.v..., dưới dạng các từ liên 
tiếp nhau, A[l,l], A[1,2J, A[l,3] và v.v... sẽ có 1000 từ phân biệt. 
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Một chương trình thực hiện tính toán trên tâ't cả phần tử của 20 
hàng đầu tiên sẽ dùng 20 vùng 20-từ với 980 từ phân cách những 
vùng này. Nếu kích thước trang là 2048 từ, ít nhất có 10 trang, 
tổng cộng 20480 từ sẽ ở trong tập vận hành. Nếu kích thước trang 
là 128 từ, dù cho mỗi vùng chiếm nhiều phần của 2 trang, chỉ có 40 
trang, tổng cộng 5120 từ được cần đến để chạy chương trình. Nếu 
bộ nhớ chính sử dụng được có nhiều hơn 5120 từ nhưng ít hơn 
20480 từ, kích thước trang lớn sẽ ngăn cản tập vận hành ở trong bộ 
nhớ chính do đó gây ra thrashỉng, trong khi kích thước trang nhỏ 
sẽ không gây ra vâh đề gì cả. 

6.1.6 Phân đoạn 

Bộ nhớ ảo thảo luận ở trên có 1-chiều bởi vì các địa chỉ ảo đi từ 
0 tới một địa chỉ tối đa nào đó, các địa chỉ liên tiếp nhau. Đọi với 
nhiều vấn đề, việc có 2 hoặc nhiều không gian địa chỉ ảo riêng biệt 
sẽ tốt hơn nhiều so với chỉ có 1 không gian địa chỉ ảo. 

Thí dụ một trình biên dịch có nhiều bảng được xây dựng khi 
tiến hành biên dịch, bao gồm: 

1. Văn bản nguồn được cất giừ để in 

2. Bảng ký hiệu chứa tên và thuộc tính của các biến 

3. Bảng hằng sô' chứa tất cả hằng số nguyên và dấu châm 
động 

4. Cây phân tích ( parse tree ) chứa phân tích cú pháp của 
chương trình 

5. Stack dùng cho việc gọi thủ tục trong trình biên dịch 

Mỗi bảng trong bôn bảng đầu có kích thước tăng liên tục theo tiến 
trình biên dịch. Bảng cuối cùng tăng và giảm theo hướng không 
đoán trước dược trong thời gian biên dịch. Trong một bộ nhớ 
1-chiều, 5 bảng này phải được câ'p phát những chunk kế cận nhau 
của không gian địa chỉ ảo như trong hình 6.11. 
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Hình 6.11 Trong một không gian địa chỉ 1-chiều với các báng tảng kích 
thước, một bảng có thế chạm vào bảng khác 

Virtual address space : khống gian địa chỉ áo 
Symbol table : báng ký hiệu 

Symbol table has bumped into the source text table : bâng ký hiệu chạm 
vào báng vàn bán nguồn 
Source text : vãn bán nguồn 
Constant table : báng hằng sô” 

Address space currently being used by the constant table : không gian dịa 
chỉ hiện hành đang được sử dụng bơi bảng hằng số 
Free : trô*ng 

Address space allocated to the constant table : không gian địa chì đả câp 

phát cho báng hằng sô 

Parse tree : cây phán tích 

Call stack : stack cho các lời gọi 

Hãy xem điêu gì sẽ xảy ra nêu chương trình có rất nhiều biến 
ngoại lệ. Chunk của không gian địa chỉ đă cấp phát cho bảng ký 
hiệu có thể đầy lên nhưng có thể còn nhiều chồ trong những bảng 

J biGH dich có thê đơn giản chi phát ra một 

thông báo nói rằng việc biên dịch không thể tiếp tục do có quá 
nhiều biến, nhưng làm như vậy dường như không hay lắm khi vẫn 
còn khoảng trông chưa sử dụng trong những bảng khác. 
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Một khả năng khác là chơi theo kiều Robin Hood, lây khoảng 
trống từ những bảng có nhiều chỗ trống và mang chúng cho những 
bảng còn ít chỗ trông hơn. Có thể thực hiện sự thay đổi này nhưng 
do tương tự như cách quản lý các overlay của chính chương trình, 
nỗi phiền toái trong hoàn cảnh tốt nhất và công việc rất buồn tẻ và 
không đáng công trong hoàn cảnh xấu nhâ't. 

Điều thật sự cần thiết là cách giải phóng những người lập trình 
khỏi phải quản lý các bảng tăng và giảm kích thước, bàng cách đó 
bộ nhớ ảo loại được mối bận tâm về cách tổ chức chương trình 
thành các overlay. 

Giải pháp rất tổng quát và không khó lắm là cung cấp cho máy 
cấp 3 nhiều không gian địa chỉ hoàn toàn độc lập gọi là các 
segment. Mỗi segment gồm có một chuỗi các địa chỉ tuyến tính từ 0 
tới một số tôi đa nào đó. Chiều dài của mỗi segment có thể là bất 
kỳ từ 0 tới một sô' tôi đa cho phép. Các segment khác nhau có thể 
và thường có những chiều dài khác nhau. Hơn nữa, chiều dài củạ 
segment có thể thay đổi trong thời gian thực thi chương trình. 
Chiều dài của segment stack có thể tăng mồi khi có một thông tin 
được cất vào stack và giảm mỗi khi có một thông tin được lấy ra 
khỏi stack. 

Bởi vì mỗi segment hình thành một không gian địa chỉ riêng, 
các segment khác nhau có thể độc lập tăng hoặc giảm mà vẫn 
không ảnh hưởng tới segment khác. Nếu stack trong một segment 
nào đó cần nhiều không gian địa chỉ để tăng, điều đó có thể xẩy ra 
bởi vì không gian địa chỉ của segment không còn bị giới hạn. D* 
nhiên một segment có thể đầy nhưng các segment thường rất lớn 
nên điều này rất hiếm khi xảy ra. 

Để xác dịnh một địa chỉ trong bộ nhớ được phân đoạn hoặc 
2-chiều này, chương trình phẩi cung cấp một địa chỉ có 2 phần, một 
cho sô' của segment và một cho địa chỉ trong segment. Hình 6.12 
minh họa một bộ nhớ được phản đoạn dùng cho các bảng của trình 
biên dịch đã bàn đến trước đây. 
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Hình 6.12 Bộ nhớ được phân đoạn cho phép mỗi bảng tăng hoặc giảm độc 

lập với các bảng khác 

Symbol table : bảng ký hiệu 

Source text : văn bản nguồn t 

Constant : hằng số 

Parse tree : cây phân tích 

Call stack : stack của lời gọi 

Cần nhấn mạnh rằng một segment là một thực thể logic mà 
người lập trình nhận thức được và sử dụng như một thực thể logic 
đơn. Một segment có thể chứa một thủ tục, một dãy, một stack hoặc 
một tập các biến vô hướng nhưng thường không chứa sự pha trộn 
của các loại này. 

Bộ nhớ được phân đoạn có những thuận lợi khác ngoài việc đơn 
giản hóa việc quản lý cấu trúc dữ liệu tăng hoặc giảm. Nếu mỗi thủ 
tục chiếm một segment riêng với địa chỉ 0 là địa chỉ bắt đầu, sự liên 
kết các thủ tục dược biên dịch riêng sẽ rất đơn giản. Sau khi tất cả 
thủ tục tạo thành chương trình được biên dịch và liên kết, một lời 
gọi thủ tục tới một thủ tục trong segment n sẽ dùng địa chỉ có 2 
phần (n, 0) để địa chỉ hóa từ 0 ( điểm nhập ). 
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Nếu thủ tục trong segment n bị thay đổi và được biên dịch lại 
sau đó, không có thủ tục nào khác cần phải thay đổi ( bởi vì không 
có địa chỉ bắt đầu nào bị thay đổi ), dù cho phiên bản mới của thủ 
tục bị thay đổi có kích thước lớn hơn phiên bản cũ. Với một bộ nhớ 
1-chiều, các thủ tục được sắp xếp rất sát nhau và không có một 
khoảng trông địa chỉ nào giữa chúng dẫn đến sự thay đổi kích thước 
của một thủ tục sẽ ảnh hưởng đến địa chỉ bắt đầu của các thủ tục 
khác, những thủ tục không liên quan đến sự thay đổi kích thước. 
Điều này đòi hỏi phải thay đổi lần lượt tất cả thủ tục mà chúng 
gọi , bất kỳ thủ tục nào đă di chuyện, để hình thành những địa chỉ 
bắt đầu mới. Nêu chương trình chứa hàng trăm thủ tục, quá trình 
này sẽ rất tốn kém. 

Sự phân đoạn cũng tạo dễ dàng cho việc dùng chung các thủ tục 
hoặc dữ liệu giữa nhiều chương trình. Nếu một máy tính có nhiều 
máy cấp 3 chạy song song ( hoặc đúng như vậy hoặc được mô phỏng 
xử lý song song ), tất cả đều sử dụng các thủ tục thư viện nào đó, ta 
sẽ phí phạm bộ nhớ chính để cung cấp cho từng máy bản sao chép 
riêng. Bằng cách tạo ra một segment riêng cho từng thủ tục, chúng 
dễ dàng được dùng chung và ta loại trừ được nhu cầu phải có nhiều 
hơn một bản sao vật lý của bất kỳ thủ tục dùng chung nào ở trong 
bộ nhớ chính. Kết quả là tiết kiệm được bộ nhớ. 

Bởi vì mỗi một segment hình thành một thực thể logic mà người 
lập trình nhận thức được như một thủ tục, một dãy hoặc một stack 
nên các segment khác nhau có thể có các loại bảo vệ khác nhau. Ta 
có thể xác định một segment thủ tục là chỉ được thực thi, cấm đọc 
hoặc ghi thông tin. Một dãy dấu châha động có thể được xác định là 
đọc / ghi nhưng không thực thi được và nếu muôứi nhảy tới sè bị bắt 
giừ. Việc bảo vệ như vậy có ích trong việc bắt các lỗi lập trình. 

I 

Ta sẽ thử tìm hiểu xem tại sao sự bảo vệ có ý nghĩa trong bộ 
nhớ được phân đoạn mà không có ý nghĩa trong bộ nhớ 1-chiều 
được phân trang. Trong một bộ nhớ được phân đoạn, người sứ dụng 
biết được cái gì ở trong mỗi segment. Thí dụ bình thường một 
segment không chứa thủ tục và stack mà chỉ chứa thủ tục hoặc chỉ 
chứa stack. Vì mỗi segment chỉ chứa một loại đôi tượng, nên 
segment có thể có sự bảo vệ thích hợp đôì với từng loại đối tượng. 
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Sự phân trang ( paging ) và sự phân đoạn { segmentation ) được so 
sánh như trong hình 6.13. 


Sự xem xét 

Phân trang 

Phán đoạn 

Người lập trình có cần 
biết kỹ thuật này đang 
được sử dụng không ? 

Không 

Co 

Có bao nhiêu không 
gian địa chí tuyến tính 

7 

1 

Nhiều 

Không gian địa chỉ 
tổng cộng có thê vượt 
quá kích thước bộ nhớ 
vật lý không ? 

Có 

Có 

Các thù tục và dữ liệu 
có thè được phân biệt 
và được báo vệ rióng rẻ 
không ? 

Không 

Có 

Các bảng mà kích 
thước cúa chúng dao 
động có thê được điều 
tiết dễ dàng không ? 

Không 

[có 

Việc dùng chung các 
thú tục cùa những 
người sứ dụng có được 
thuận lợi không ? 

Không 

Có 

Tại sao kỳ thuật này 
được phát minh ? 

Đè có một không gian địa 
chỉ tuyến tính lớn mà 
không cần phải mua 
nhiều bộ nhớ vật lý 

Đẽ cho phép các chương 
trình và dử liệu dược chia 
ra thành nhiều không 
gian địa chỉ ỉogic độc lập 
và đế cung cả'p khả năng 
dùng chung và bảo vệ 


Hình 6.13 So sánh phân trang và phân đoạn 

Theo một nghĩa nào đó nội dung của trang là ngẫu nhiên. 
Những người lập trình thậm chí không biết thực tế sự phân trang 
đang xảy ra. Mặc dù việc đặt một vài bit trong mồi điểm nhập của 
bảng trang chi rõ là được phép truy xuất, để lợi dung đặc tính này 
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những người lập trình phái theo dõi đâu là các ranh giới của trang 
( page boudary ) trong không gian địa chỉ của họ, và đây chính là 
cách quản lý mà sự phản đoạn được phát minh để loại bỏ. Bới vì 
những người sử dụng bộ nhớ được phân đoạn có áo tướng là lúc nào 
tất cả segment cũng đều ớ trong bộ nhớ chính, nghĩa là họ có thè 
địa chỉ hóa chúng như thê chúng có ở trong bộ nhớ chính, họ có thế 
bảo vệ riêng từng segmcnt mà không liên quan tới sự quán lý các 
overlay. 

6.1.7 Hiện thực phân đoạn 

Về cơ bán việc hiện thực sự phân đoạn khác với phàn trang ó 
chỗ : các trang có kích thước cỏ định còn các segmcnt thì khỏng. 
Hình 6.14(a) trình bày một thí dụ về bộ nhớ vật lý ban đầu có 5 
segment. 

Bây giờ ta xét xem điều gì sẽ xảy ra nếu segmcnt 1 bị bò đi và 
segment 7, segment nhỏ hơn, được đặt vào chỗ của scgmcnt 1. 
Chúng ta đi đèn cẩu hình bộ nhớ ở hình 6.14(b). Giữa segment 7 và 
segment 2 có một vùng chưa sử dụng, nghĩa là một lỗ trông ( hole ). 
Sau đó segment 4 được thay bằng segmcnt 5 như trong hình 6.14ỈC) 
và segment 3 được thay bằng segmcnt 6 như trong hình 6.14(dj. 

Sau khi hệ thống chạy được một lúc, bộ nhớ sè bị chia thành 
nhiều chunky một sô" chứa các segment và một sô chứa các lồ trông. 
Hiện tượng này được gọi là hiện tượng bàn cờ ( checkerboarding ) 
và kết quả là bộ nhớ bị bỏ phí ơ những lồ trông. 

Hãy xem điều gì sẽ xảy ra nếu chương trình tham chiêu scgmcnt 
3 ở thời điếm bộ nhớ có hiện tượng bàn cờ như trong hình 6.14(đ). 
Toàn bộ không gian trong các lỗ trốrig là 10K, dư chồ cho segment 3 
nhưng bởi vì không gian các lỗ trông bị phân bô nhỏ, những mảng 
vô dụng, nên segment 3 không thể được nạp vào một cách đơn gián. 
Thay vào đó trước tiên phải loại bỏ một segment khác. 

Một phương pháp để tránh sự hiện tượng bàn cờ này như sau : 
mỗì lần xuất hiện một lỗ trông ta di chuyến các segment theo sau lổ 
trống đó về phía vị trí 0 của bộ nhớ, do vậy loại được lồ trông đó 
nhưng để lại một lỗ trống lớn ở đầu cuôì. Một cách khác, người ta 
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có thể chờ cho tới khi hiện tựợng bàn cờ trở nên rất nghiêm trọng 
( thí dụ nhiều hơn sô' phần trăm nào đó của tổng bộ nhớ bị bỏ phí 
trong các lỗ trống ) trước khi thực hiện việc cô đọng. 


Hình 6.14 (a) - (d) Sự phát triển của hiện tượng bàn cờ (e) Loại bỏ hiện 

tượng bàn cờ bằng cách cô dọng 

Hình 6.15(e) trình bày bộ nhớ hình 6.14(d) sau khi cô đọng. Ý 
định cô đọng bộ nhớ là tập hợp tất cả những lỗ trông nhỏ không sử 
dụng lại thành một lồ trông lớn, trong đó có thể đặt một hoặc 
nhiều segment. Phương pháp cô đọng rõ ràng có trở ngại là phải 
tốn một khoảng thời gian để thực hiện việc cô đọng. Cô đọng sau 
khi có nhiều lỗ trống được tạo ra thường tốn rất nhiều thời gian. 

Nêu thời gian cần cho việc cô đọng bộ nhớ lớn không thể chấp 
nhận được, ta cần có một giải thuật để xác định lỗ trông nào sẽ 
được dùng cho một segment cụ thể. Việc quản lý lỗ trống đòi hỏi 
duy trì một danh sách các địa chỉ và kích thước của tất cả lỗ trống. 
Một giải thuật thông dụng gọi là best fit ( vừa khít nhất ) chọn lỗ 
trống nhỏ nhất vừa với segment cần đưa vào. Ý tưởng tương thích 
lỗ trông và segment như thế tránh được việc cắt đứt một phần 
trong một lồ trống lớn, mà sau này lỗ trống có thể cần cho một 
segment lớn. 

Một giải thuật thông dụng khác gọi là first fit ( vừa khít đầu 
tiên ), giải thuật này quét vòng tròn danh sách lỗ trống và chọn lỗ 
trông đầu tiên đủ lớn vừa cho segment. Thực hiện như vậy rõ ràng 
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tốn ít thời gian hơn việc kiểm tra toàn bộ danh sách để tìm ra lỗ 
trống vừa khít nhất. Điều đáng ngạc nhiên là first fit lại là giải 
thuật tốt hơn best fĩt về mặt hiệu suất tổng thể bởi vì giải thuật 
best fit có khuynh hướng tạo ra nhiều lỗ trông nhỏ, các lỗ trống 
hoàn toàn vô ích ( Knuth, 1974 ). 

Các giải thuật fĩrst fit và best fit có khuynh hướng làm giảm 
kích thước lỗ trông. Mỗi khi một segment dược đặt vào một lỗ trống 
lớn hơn chính segment, điều này hầu như xảy ra mọi lúc ( vừa khít 
chính xác rất hiếm khi xãy ra ), lồ trông dược chia thành 2 phần. 
Một phần được segment chiếm chỗ và phần kia là một lỗ trống mới. 
Lỗ trông mới luôn luôn nhỏ hơn lỗ trống cũ trừ khi có một quá 
trình bổ chính để tái tạo lại các lỗ trông lớn từ những lỗ trống nhỏ, 
cả 2 giải thuật first fit và best fư cuối cùng cũng sẽ làm đầy bộ nhớ 
bằng những lỗ trống nhỏ vô ích. Một quá trình bù lỗ trông như vậy 
là một quá trình sau đây. Mỗi khi một segment bị loại khỏi bộ nhớ 
và một hoặc 2 không gian gần segment này nhất là các lỗ trống chứ 
không phải là các segment, các lỗ trống kề nhau có thể được kêt 
hợp lại thành một lỗ trông lớn. Nếu segment 5 bị loại khỏi hình 
6.14(d), 2 lỗ trống phụ cận và 4K của segment 5 này được hợp lại 
thành một lỗ trông 11K. 

6.1.8 Bộ nhớ ảo trên MULTICS 

Qua nhiều năm, các khoa học gia máy tính nhận ra rằng bộ nhớ 
ảo lý tưởng bao gồm rất nhiều segnient lớn. Vào những năm đầu 
thập niên 1960, M.I.T., Bell Labs và General Electric ( sau đó là 
Honeywell ) đã thiết lập một đề án chung để xây dựng một hệ điều 
hành nhằm cung cấp một không gian địa chỉ như vậy cũng như 
nhiều đặc tính nâng cao khác. Sự hợp tác này dẫn đên hệ 
MƯLTICS ( Corbató and Vyssotsky, 1995 ; Dley and Neumann, 
1965 ; Organick, 1972 ), mặc dù tự hệ thống này không phải là một 
thành công tuyệt diệu nhưng có một ảnh hưởng đáng kể về cách 
con người nghĩ về bộ nhớ ảo. ở một mức độ nào đó, không có hệ 
diều hành nào được xây dựng, từ khi có hệ MULTICS, tiên gần đên 
sự tinh vi của hệ này, mặc dù có một sô' hệ điều hành đã thử. Với 
lý do này bộ nhớ ảo của MULTICS đáng được khảo sát chi tiết. 
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Hệ MƯLTICS chạy trên các máy Honeywell 6000 và tổ tiên của 
chúng, cung cấp cho mồi một chương trình một bộ nhớ ảo lên tới 2 18 
segmcnt { nhiều hơn 250.000 ), mỗi segment có thể dài 65536 từ 36- 
bit. Đê thực hiện điều này, các nhà thiết kế MƯLTICS đã chọn 
cách xứ lý từng segment như một bộ nhớ ảo và phản trang segment 
bằng cách kết hợp những lợi điểm cùa phân trang ( kích thước 
trang thống nhất và không phải giữ toàn bộ segment trong bộ nhớ 
nếu chí có một phần của segnient được sử dụng ) với những thuận 
lợi cùa phân đoạn ( dễ lập trình, có tính môđun, được bảo vệ và 
dùng chung ). 

Mỗi chương trình cua hệ MƯLTICS có một bảng segment cùng 
với một bộ đặc tả ( descriptor ) cho mỗi segment. Vì có khả năng có 
nhiều hơn Vị triệu điểm nhập trong bảng, nên bản thân bảng 
segmcnt là một segment và được phân trang. Một bộ đặc tả segment 
chứa một chi dẩn ( indication ) cho biết segment có ở trong bộ nhớ 
chính hay không. Nếu bất kỳ một phần nào cứa segment đang ở 
trong bộ nhớ, ta xem như segment đó ở trong bộ nhứ và bảng trang 
của scgment sẽ à trong bộ nhớ. Nếu segment ở trong bộ nhớ, bộ đặc 
tả cùa segment chứa một con trò trỏ tới bảng trang của segment 
[ xem hình 6.15(a) Ị. Do cáo địa chỉ bộ nhớ vật lý có 24 bit, 6 bit 
thấp cùa địa chỉ được xem như bằng 0. Bộ đặc tả cũng chứa kích 
thước của segmenty các bit bảo vệ và một vài phần tử khác. Hình 
6.15(b) minh họa bộ đặc tả segment của hệ MULTICS. Địa chỉ của 
scgment trong bộ nhớ phụ không ớ trong bộ đặc tả segment mà ở 
trong một bảng khác được bộ điều khiển lỗi segment (segment íault 
handler) sử dụng. 

Mỗi segment có một không gian địa chỉ và được phân trang theo 
cách một bộ nhớ dược phản trang nhưng không được phân đoạn đã 
mô tả ở đầu chương này. Kích thước trang bình thường là 1024 từ 
( mặc dù có một vài segment nhỏ dược MƯLTICS sử dụng không 
được phân trang hoặc được phân trang thành các đơn vị 64-từ ). 
Một địa chỉ trong MULTICS gồm có 2 phần : segnient và địa chỉ 
trong segment. Địa chỉ trong segment được chia thành một sô' của 
trang và một từ trong trang như trình bày trong hình 6.16. Khi xảy 
ra một tham chiếu bộ nhớ, giải thuật sau đây được thực hiện : 
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1. Sô cua segment được dùng đê tìm bộ đặc tả segmcnt 

2. Thực hiện kiểm tra đè xem báng trang cúa segment có ớ 
trong bộ nhớ không. Nếu không có sẽ xuảt hiện một lỗi 
segment. Nếu có một vi phạm bảo vệ sẽ xuất hiện một 
lỗi ( một bầy ). Nếu báng trang ớ trong bộ nhớ, báng 
trang được định vị 
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Hình 6.15 Bộ nhớ ào cùa MƯLTICS ía) Segment cùa bộ đặc ta trò tới các 
bảng trang (b) Một bộ đạc tá segnient. Các số là chiều dài của các trường. 
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Description segment : segment của bộ đặc tẩ 
Segment 0 description : bộ đặc tả segmerxt 0 
Page table for segment 0 : bảng trang cho segment 0 
Page 0 entry : điểm nhập 0 của trang 
Pointers to the pages : trỏ tới các trang 

Main memory adđress of the page table : địa chỉ bộ nhớ của bảng trang 
Segment ỉength ( in pages ) : chiều dài của segment ( tính bằng trang ) 

Page size : kích thước trang 

0 = 1024 words : 0 = 1024 từ 1 = 64 words : 1 = 64 từ 

0 = segment is paged : 0 = segment được phân trang 
1 = segment is not paged : 1 = segment không được phân trang 
Misceìlanous bits : các bít linh tinh 
Protection bits : các bít báo vệ 

3. Kiểm tra điếm nhập cúa báng trang đối với trang ảo 
được yêu cầu. Nếu trang không ở trong bộ nhớ, xuất hiện 
lỗi trang. Nếu trang ở trong bộ nhớ, địa chỉ bộ nhớ 
chính của đầu trang được lấy ra từ điểm nhập của bảng 
trang 

4. Oíĩset được cộng với trang gốc cho biết địa chỉ bộ nhớ 
chính nơi định vị từ nhớ 

5. Cuối cùng tiến hành đọc hoặc cất giữ từ nhớ 

Quá trình này được minh họa trong hình 6.17. Để đơn giản, việc 
bản thân segment của đặc tả được phân trang có thể bỏ qua. Điều gì 
thực sự xảy ra nếu một thanh ghi, gọi là thanh ghi nền của bộ đặc 
tả được dùng đê định vị bảng trang của segment bộ đặc tả, lần lượt 
trỏ tới các trang của segment bộ đặc tả. Một khi tìm thấy bộ đặc tả 
cho segment cần thiết, việc định địa chỉ tiến hành như trình bày 
trong hình 6.17. 
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the segment 


Segment number 


Page 
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number 

the page 


18 


lơ 


Hình 6.16 Địa chỉ ảo 34-bit của hệ MULTICS 
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Segment number : số của segment 

Page number : sô của trang 

Offset within the page : offset trong trang 

Address within the segment : địa chỉ trong segment 


MULTICS Virtual address 



Page 


Hình 6.17 Đổi địa chỉ 2-phần của hệ MULTICS thành địa chỉ của bộ nhổ 

chính 

MƯLT1CS Virtual address ; địa chỉ ảo của MULTICS 

Segment number : sô của segrnent 

Page number : số cúa trang 

Oíĩset within the page : offset trong trang 

Descriptor : bộ đặc tả 

Descriptor segment : segnient bộ đặc tả 

Page frame : khung trang 

Page table : bảng trang 

Page : trang 
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Lúc này chắc chắn ta đoán được nếu giải thuật trước thực sự 
được hệ điều hành thực thi trên mọi chỉ thị, các chương trình sẽ 
không thề chạy rât nhanh. Trong thực tế, phần cứng của hệ 
MƯLTICS có một bộ nhớ kết hợp ( associative memory ) tốc độ cao 
16-từ có thê tìm kiếm tất cá điếm nhập theo cách song song với 
một khóa cho trước. Bộ nhớ được minh họa trong hình 6.18. Khi 
một địa chỉ được đưa tới máy tính, phần cứng định địa chỉ trước 
tiên kiếm tra xem có phải là địa chỉ ảo ớ trong bộ nhớ kết hợp 
không. Nêu có, phần cứng lây số cùa khung trang trực tiếp từ bộ 
nhớ kết hợp và hình thành địa chỉ thực sự cùa từ được tham chiếu 
mà không phai tìm trong segmcnt bộ đặc tả hoặc bảng trang. 
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Comparlson entrỵ 
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number page trame Prolectlon Age 
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Execute only 
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12 

Execute only 
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Hình 6.18 Một phiên bán được đơn gián cua bộ nhớ kết hợp MULTICS. Sự 
tồn tại của 2 kích thước trang làm cho bộ nhớ kết hợp phức tạp hơn 

Comparision fielđ : trường so sánh 
Segment number : số cúa segment 
Virtual page : trang ảo 
Page frame : khung trang 
Protection : bao vệ 
Age : tuổi 

Is this entry used : có phải điểm nhập này được dùng ? 

Read / write : đọc / ghi 
Read only : chi đọc 
Execute only : chi thực thi 
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Địa chỉ của 16 trang được tham chiếu gần đây nhất được giữ 
trong bộ nhớ kết hợp. Các chương trình mà tập vận hành cúa 
chúng nhỏ hơn kích thước của bộ nhớ kết hợp sẽ đi tới sự cản bàng 
với các địa chỉ của tập vận hành toàn thể trong bộ nhớ kết hợp và 
như vậy chương trình chạy sê có hiệu quá. Nếu trang không ớ trong 
bộ nhớ kêt hợp, bộ đặc tá và các bảng trang thực sự được tham 
chiếu dể tìm địa chỉ khung trang và bộ nhớ kết hợp được cập nhật 
để bao gồm trang này, trang ít sứ dụng gần dây nhát bi loại bõ. 
Trường age theo dõi xem điếm nhập nào ít dược sứ dụng gần đáy 
nhất. Nguyên nhân sứ dụng bộ nhớ kết hợp là số cũa scgment và số 
của trang cua mọi điếm nhập có thề được so sánh đồng thời dê tăng 
tốc độ. 

6.1.9 Bộ nhớ ảo trên 80386 của Intel 

8088 không có bộ nhớ ảo nên ta không thê khảo sát ờ đây. 
80286 có bộ nhớ ảo nhưng 80386 lại có nhiều diều thú vị hơn vì thế 
ta sẽ tập trung vào bộ nhớ ảo của 80386. Trong chừng mực nào đó 
bộ nhớ ảo trên 80386 tương tự như bộ nhớ áo trên hệ MULTICS, 
bao gồm sự hiện diện của phân đoạn và phán trang. Trong khi 
MƯLTICS có 256K segment độc lập, mỗi segment có thể đến 64K từ 
36-bit, 80386 có 16K segment độc lập, mồi segmcnt chứa 1 tỉ từ 32- 
bit. Mặc dù có ít scgmcnt hơn nhưng kích thước scgment lớn hơn lại 
quan trọng hơn nhiều, vì có ít chương trình cần nhiều hơn 1000 
segnient nhưng lại có nhiều chương trình cần các segmcnt chứa được 
tới hàng megabyte. 

Phần trung tâm cúa bộ nhớ áo 80386 gồm có 2 báng, báng dặc 
tả cục bộ LDT ( local descriptor table ) và bàng đặc ta toàn cục 
GDT ( global descriptor table ). Mỗi chương trình có một bảng LDT 
riêng và chỉ có một bảng GDT dùng chung cho tất cá chương trình 
trên máy tính. Bảng LDT mô tá các segment cục bộ cho từng 
chương trình bao gồm mã, dừ liệu, stack và v.v..., trong khi báng 
GDT mô tả các segment hệ thông bao gồm chính hệ điều hành. 

Như đả mô tả trong chương 4, đế truy xuất một segment, chương 
trình của 80386 trước tiên nạp một bộ chọn ( selector ) cho segnient 
đó vào một trong 6 thanh ghi segment. Trong thời gian thực thi, cs 
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chứa bộ chọn cho segment mã, DS chứa bộ chọn cho segment dữ liệu 
và v.v... Mỗi bộ chọn là một sô 16-bit như trình bày trong hình 
6.19. 


Bits 


13 


1 2 


INDEX 


0= GDT/1 = LDT 




PRIVILEGE LEVEL (0-3) 


Hình 6.19 Một bộ chọn của 80386 

Privilege level : mức đặc quyền 
Index : chỉ sô' 


Một trong các bit của bộ chọn cho biết segment là cục bộ hay 
toàn cục ( nghĩa là segment là LDT hay GDT ). 13 bit khác xác định 
số của điểm nhập của LDT hoặc GDT vì thế các bảng này có giới 
hạn lưu trữ là 8K ( 2 13 ) các bộ đặc tả segment. 2 bít khác liên quan 
tới sự bảo vệ sẽ được mô tả sau. Bộ đặc tả 0 bị cấm. Bộ đặc tả này 
có thể dược nạp một cách an toàn vào một thanh ghi segment để 
cho biết thanh ghi segment đó hiện tại chưa sử dụng được nhưng 
nếu sử dụng sẽ gây ra một bầy. Vào lúc một bộ chọn dược nạp vào 
một thanh ghi segment , bộ đặc tả tương ứng được tìm nạp từ LDT 
hoặc GDT và được cất vào các thanh ghi của vi chương trình, nhờ 
vậy ta có thể truy xuất bộ đặc tả một cách nhanh chóng. Một bộ 
đặc tả có 8 byte bao gồm địa chỉ nền của segmenty kích thước và 
thông tin khác, như mô tả trong hình 6.20. 


•32 Btts 


Base 0-15 


BASE 24-31 


0: Ị.ỊMỊT Ịs Ịn bytesl 
1: ŨMỈT is in pagesj 

0:16-Bits segmentỊ 
1: 32-BĨĨ segment. 




LIMIT 


DPL 


TYPE 


n 


BASE 16-23 


Rẹlạttve 

address 

0 


Segment type and protectlon 

— Privllege level (0-3) 

r0: Segment Ịs absent from mamory 
Li : Segment is present In memory 


llình 6.20 Bộ đặc tả segment mã cúa 80386. Segment dừ liệu có hơi khác 
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Relative address : địa chỉ tương đối 
BASE : trường nền ■* 

LIMIT : trường giới hạn 
TYPE : trường loại ( hay kiểu ) 

0 : LIMIT is in bytes : 0 : LIMIT tính bằng byte 
1 : LIMIT is in pages : 1 : LIMIT tính bằng trang 
0 : 16-bit segment : 0 : segment 16-bit 
1 : 32-bit segment : X : segment 32-bìt 
Segment type and protection : loại segment và bảo vệ 
Privilege level ( 0 - 3 ) : mức đặc quyền ( 0 — 3 ) 

0 : segment is absent from memory : segment vắng mặt khỏi bộ nhớ 
1 : segment is present in memory : segment hiện diện trong bộ nhớ 

Khuôn dạng của bộ chọn được chọn một cách thông minh dể 
làm cho việc định vị bộ đặc tả được dề dàng. Trước tiên hoặc LDT 
hoặc GDT được chọn dựa vào bit 2 của bộ chọn. Sau đó bộ chọn 
được sao chép vào thanh ghi nháp của vi chương trình và 3 bit thấp 
được thiết lập bằng 0. Cuối cùng, địa chỉ của bảng LDT hoặc GDT 
được cộng với bộ chọn đẽ cho một con trỏ trực tiếp tới bộ đặc tả. 
Thí dụ bộ chọn 72 tham chiếu tới điểm nhập 9 trong GDT, được 
định vị ở địa chỉ GDT + 72. 

Ta hãy theo dõi các bước mà trong đó một cặp ( bộ chọn, offset ) 
được đổi thành địa chỉ vật lý. Ngay khi vi chương trình biết thanh 
ghi segment nào dang được sử dụng, chương trình này tìm bộ đặc tả 
đầy đủ tương ứng với bộ chọn đó trong các thanh ghi nội. Nếu 
segment không tồn tại ( bộ chọn 0 ), hoặc segment vắng mặt khỏi 
bộ nhớ ( p bằng 0 ), một bẫy xuât hiện. 

Sau đó vi chương trình kiểm tra xem oíĩset có vượt ra ngoài đầu 
cuô"i của segment hay không, trong trường hợp đó bầy cũng xảy ra. 
Một cách logic, có một trường 32-bit trong bộ đặc tả cho biết kích 
thưdc của segment nhưng chỉ sử dụng được 20 bit nên người ta dùng 
một sơ đồ khác. Nếu trường G ( granularity ) là 0, trường LIMIT 
đúng là kích thước của segment , lên tới 1MB. Nếu G là 1 , trường 
LIMIT cho biết kích thước của segment tính bằng trang thay vì 
bằng byte. Kích thước trang của 80386 cố định là 4K byte nên 20 
bit là đủ đôi với các segment lên đến 2 32 byte. 
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Giả thiết rằng segment ở trong bộ nhớ và offset ở trong phạm vi 
hoạt động, 80386 cộng trường BASE 32-bit trong bộ đặc tả với 
offset đê hình thành địa chỉ tuyến tính như trình bày trong hình 
6.21. Trường BASE được tách thành 3 phần và tát cả được phân 
phối trên bộ dặc tả đê tương thích với 80286 ớ đó trường BASE chỉ 
có 24 bít. Trường BASE cho phép mỗi một segment được bắt dầu ở 
một nơi tùy ý trong khỏng gian địa chí tuyến tính 32-bit. 



Hình 6.21 Đôi một cặp ( bộ chọn, ofí'set ) thành một địa chi tuyến tính 

Selector : bộ chọn Descriptor : bộ đặc tả 

Base address : trường địa chỉ nền Limit : trường giới hạn 

Other fields : các trường khác 
32-bit ìinear address : địa chì tuyến tính 32-bit 

Nếu sự phán trang không được phép ( do một bit trong thanh 
ghi điều khiên toàn cục ), địa chỉ tuyên tính được phiên dịch như 
địa chì vật lý và được gời tới bộ nhớ cho thao tác đọc hoặc thao tác 
ghi. Như vậy nếu không được phép phân trang, ta có sơ đồ phân 
đoạn thuần túy, với địa chỉ nền của mồi một segnicnt được cho biết 
trong bộ đặc tá segment. Các segmcnt được phép chồng gối lên nhau 
một cách ngâu nhiên, có lẽ do bới người* ta đà có quá nhiều phiền 
phức và tốn quá nhiều thời gian để kiểm tra rằng tất cả các 
segment đều tách rời nhau, 

Mặc khác, nếu phân trang được cho phép, địa chỉ tuyến tính 
được phiên dịch như địa chỉ ảo và được ánh xạ lên địa chỉ vật lý 
bằng cách dùng các bảng trang. Điều rắc rối duy nhất là với một 
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địa chỉ ảo 32-bit và một trang 4K, một segment có thề chứa 1 triệu 
trang vì thế người ta dùng một ánh xạ 2-cấp dê làm giảm kích 
thước bảng trang đối với các segment nhỏ. 

Mỗi một chương trình đang chạy đều có một thư mục trang 
( page directory ) bao gồm 1024 điểm nhập 32-bit. Thư mục trang 
được định vị ở một dịa chỉ do một thanh ghi toàn cục trỏ tới. Mỗi 
điểm nhập trong thư mục này trỏ tới một bảng trang cũng chứa 
1024 điểm nhập 32-bit. Các điểm nhập của bảng trang trò tới các 
khung trang. Sơ đồ được trình bày trong hình 6.22. 


Blts 


10 


Unear address 
10 


12 


DIR 


PAGE 


OFF 


(a) 



1024 

Entrles 

ị 


Page directory 

♦ t 


Page frame 


Hình 6.22 Ánh xạ một địa chỉ tuyến tính lèn một địa chì vật lý 

Linear address : địa chi tuyến tính 
Page directory : thư mục trang 
Page table : bảng trang 
Page írame : khung trang 
1024 entries : 1024 điểm nhập 

Trong hình 6.22(a) ta thấy một địa chỉ tuyên tính dược tách 
thành 3 trường, DIR, PAGE và OFF. Trường DIR được dùng như 
một chỉ sô" trong thư mục trang đê định vị một con trô trỏ tới bảng 
trang thích hợp. Trường PAGE được dùng như một chỉ sô' trong 
bảng trang đế tìm địa chỉ vật lý của khung trang. Trường OFF được 
cộng với địa chỉ cúa khung trang để cho dịa chỉ vật lý cúa byte hoặc 
từ đã đia chỉ hóa. 
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Mỗi điểm nhập của bảng trang có 32 bit, 20 bit chứa số của 
khung trang. Các bit còn lại chứa bit truy xuât được và bit dơ được 
thiết lập bởi phần cứng vì ích lợi của hệ điều hành, các bit bảo vệ 
và các bit tiện ích khác. 

Mỗi bảng trang có các điểm nhập cho 1024 khung trang 4K, vì 
thế một bảng trang điều khiển được 4 megabyte bộ nhớ. Một 
segment có kích thước nhỏ hơn 4M sẽ có một thư mục trang với một 
điểm nhập, mật con trỏ trỏ tới một và chỉ một bảng trang. Theo 
cách này, các segment ngắn chỉ tcứi 2 trang thay vì cần một triệu 
trang được cần trong một bảng trang 1-cấp. 

Jế 

Để tránh lập lại nhửng tham chiếu tới bộ nhớ, 80386, giông như 
MƯLTICS, có một bộ nhớ kết hợp nhỏ để ánh xạ trực tiếp các kết 
hợp DIR-PAGE ít sử dụng gần đây nhất lên dịa chỉ vật lý của 
khung trang. Chỉ khi sự kết hợp hiện tại không hiện diện trong bộ 
nhớ kết hợp thì cơ chế của hình 6.22 mới thực sự được thực hiện và 
bộ nhớ kết hợp được cập nhật. 

Suy nghĩ thêm một chút ta sẽ phát hiện ra rằng khi sử dụng 
phân trang, không có điểm nào trong bộ đặc tẩ có trường BASE 
khác không. Tảt cả những gì trường BASE làm là gây ra một offset 
nhỏ để sử dụng một điểm nhập ở giừa thư mục trang thay vì ở dầu 
thư mục trang. Nguyên nhản thực sự của việc bao gồm trường BASE 
là để cho phép có sự phân đoạn thuần túy ( không có phân trang ) 
và để tương thích với 80286, ở đó sự phân trang luôn luôn không 
được phép ( nghĩa là 80286 chỉ có phân đoạn thuần túy, không có 
phân trang ). 

Cũng nên lưu ý là nêu một ứng dụng cụ thể không cần sự phân 
đoạn nhưng lại muốn có một không gian địa chỉ 32-bit được phân 
trang ( kiểu Motorola ), ta dễ dàng đạt được điều này. Tất cả thanh 
ghi segment có thể được thiết lập với cùng một bộ chọn mà đặc tả 
có trường BASE = 0 và trường LIMT được thiết lập tối đa. Offset 
của chỉ thị sẽ là địa chỉ tuyến tính, với chỉ một không gian địa chỉ 
được sữ dụng, thực tế đây là phân trang truyền thống. 

Người ta tin vào các chuyên gia thiết kế 80386 r những người dã 
đưa ra những mục tiêu đối lập nhau về việc hiện thực phân trang 
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thuần túy, phân đoạn thuần túy và các segment có phản trang , 
trong lúc đồng thời cũng tương thích với 80286 và thực hiện có hiệu 
quả tất cả công việc này, thiết kế đạt được lại đơn giản và rõ ràng 
một cách đáng ngạc nhiên. 

Mặc dù ta đã theo dõi đầy đú câu trúc của bộ nhớ ảo 80386, tuy 
chỉ ngắn gọn, ta cũng nên nói vài điều về sự bảo vệ (protection) vì 
chủ đề này có liên quan mật thiết tới bộ nhớ ảo. Cũng như sơ đồ bộ 
nhớ ảo được mô hình rất giống với MƯLTICS, 80386 cũng có hệ 
thống bảo vệ. 80386 hố trợ 4 mức bảo vệ ( trong MƯLTICS gọi là 
rỉng ), mức 0 là mức có ưu tiên cao nhất và mức 3 là mức có ưu tiên 
thấp nhất. Các mức này được trình bày trong hình 6.23. ơ từng 
thời điếm, một chương trình đang hoạt động sẽ có một mức ưu tiên 
được cho biết bởi trường 2-bit trong PSW của chương trình. Hơn 
nữa, mỗi segment trong hệ thông cũng thuộc vào một mức nào đó. 

Miễn là bản thân một chương trình tự giới hạn việc sử dụng các 
segment ở mức riêng, mọi công việc đều được thực hiện tốt đẹp. Ta 
được phép truy xuất dữ liệu ờ một mức cao hơn nhưng không được 
phép ở mức thâ'p hơn. Các lời gọi thủ tục ở một mức khác ( cao hơn 
hoặc thấp hơn ) được cho phép nhưng phải theo một cách được điều 
khiển cẩn thận. Để thực hiện một lời gọi liên mức, các chỉ thị 
CALL phải chứa một bộ chọn thay vì một địa chỉ. Bộ chọn này chi 
rõ một bộ đặc tả được gọi là cống gọi ( call gate ) đề cung câp địa 
chỉ của thủ tục được gọi. Như vậy không thể có thao tác nhảy vào 
giữa một segment mã tùy ý ở một mức khác. Chỉ có những điểm 
nhập chính thức được sử dụng. Giông như bản thân cơ chê vòng, 
khái niệm này cũng được phát triển đầu tiên trong MƯLTICS. 

Việc sử dụng điển hình Cơ chê này được đề nghị trong hình 6.23. 
ở mức 0 ta thây lõi ( kernel ) của hệ điều hành ; lõi điều khiến I/O, 
quản lý bộ nhớ và thực hiện những vấn đề quan trọng khác, ơ mức 
1 ta có trình điều khiến gọi hệ thông ( System call handler ). Các 
chương trình của người sử dụng có thể gọi các thủ tục ở đây để thực 
hiện-các lời gọi hệ thống, nhưng có một danh sách thủ tục cụ thể 
và có bảo vệ được gọi. Mức ưu tiên 2 chứa các thủ tục thư viện có 
thể được dùng chung giữa những chương trình dang hoạt động. Các 
chương trình của ngửời sử dụng có thể gọi những thủ tục này và đọc 




MI 438 


Cấu trúc Máy tính 


dừ liệu của chúng nhưng không thể thay dổi chúng. Cuôi cùng, các 
chương trình của người sử dụng chạy ở mức 3 có mức bảo vệ thấp 
nhâ't. Các bẫy và các ngắt sử dụng cơ chế tương tự như các cổng gọi. 
Chúng cũng tham chiếu các bộ đặc tả chứ không phải các địa chỉ 
tuyệt đối và các bộ đặc tả này trỏ tới các thủ tục cụ thể để được 
thực hiện. Trường DIR trong hình 6.22 phán biệt các segment mã, 
segment dữ liệu và nhiều loại cổng khác nhau. 



Hình 6.23 Bão vệ trên 80386 

User programs : các chương trình cùa người sử dụng 
Shared libraries : các thư viện dùng chung 
System calls : các lời gọi hệ thống 
Kernel : lỏi 
Level : mức 

Typical uses of the levels : các sử dụng điển hình của các mức 

6.1.10 Bộ nhớ ảo trên 68030 của Motorola 

68000 không được hỗ trợ bộ nhớ ảo giông như 8088, nhưng 
giông như 80386, 68030 cũng có bộ nhớ ảo mà ta sẽ nghiên cứu ở 
đây. 68020 có thể hồ trợ bộ nhớ ảo với sự giúp đỡ của chip quản lý 
bộ nhớ MMU bên ngoài nhưng tối thiểu chúng cũng có sự khác 
nhau, 68020 và 68030. 
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Một cách khái quát, bộ nhớ ảo trên 68030 đơn giản, được phân 
trang nhưng sự hiện thực bộ nhớ này có hơi tỉ mỉ nhằm cung cã"p 
một sự linh động tối đa. Nơi thích hợp để bắt đầu là hình 6.22 
trong đó trình bày cách 80386 ánh xạ một địa chỉ ảo 32-bit lên một 
địa chỉ vật lý 32-bit thông qua 2 bảng trang. 68030 không có sự 
phân đoạn bộ nhớ vì thế quá trình tìm kiếm bắt đầu với một địa 
chỉ ảo 32-bit được CPU trực tiếp tạo ra ( thí dụ kiểu định địa chỉ 
trực tiếp, gián tiếp thanh ghi hoặc định chỉ SCI ) và kết thúc với một 
địa chỉ vật lý 32-bit dược gời tới bộ nhớ qua bus. 

Không giỏng 80386 có các báng trang 2-mức, 68030 có một sô" 
thay đổi giữa 0 và 4 được điều khiển bởi phần mềm. Thay vì chia cố 
định ( 10,10,12 ) như hình 6.22, sô' các bit trong mỗi mức có thể 
được quyết định bởi hệ diều hành bằng cách thiết lập các trường 
trong thanh ghi toàn cục, thanh ghi điều khiển tịnh tiến TCR 
( translation control register ). Hơn nữa do có nhiều chương trình 
cần ít hơn 2 :1 ~ byte bộ nhớ nên có thể báo cho MMU biết đề bó qua 
n bit cao nhất. 

Ta hãy khảo sát thí dụ tương đôi đơn giản trong hình 6.24(a), 
hình này trình bày một trong nhiều phương pháp tách địa chỉ ảo 
32-bit. ơ đây ta quyết định bỏ qua 12 bit cao ( nghĩa là địa chỉ ảo 
phái thấp dưới IM ), theo sau là 3 mức của bảng tìm kiếm, A, B và 
c. Mức thứ 4 ( D ■) không được dùng trong thí dự này. Kích thước 
trang được thiết lập bời hệ điều hành. Tất cả các lũy thừa của 2 từ 
256 byte tới 32K đều được phép. Trong thí dụ này ta chọn 11 bit 
cấp phát cho trường OFFSET với ngụ ý kích thước trang là 2K. 

Hình 6.24(b) trình bày một địa chỉ ảo, 000AE006H, được chia 
theo sự phân chia của hình 6.24(a). Trong khuôn dạng này, bảng 
đầu tiên được cấp 4 bit nên có 16 điểm nhập ( nhưng có thê ít 
hơn ). Điếm nhập dầu tiên trong bảng này áp đụng cho các địa chỉ 
ảo trong tầm từ 0000H tới FFFFH. Điểm nhập 2 ánh xạ địa chì từ 
10000H tới 1FFFFH và v.v... Khi được biểu diễn bằng địa chỉ ảo 
trong hình 6.24(b), MMU trong chip bỏ qua các bít từ 20 tới 31 và 
sử dụng các bit từ 16 tới 19 như một chỉ sô" trong bảng A, như trình 
bày trong hình 6.24{c). 
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Blts 

12 

4 

3 

2 

11 


SKIP 

A 

B 

c 

OFFSET 




(a) 



Bits 

12 

4 

3 

2 

11 


000000000000 

1010 

111 

00 

00000000110 


(b> 


c tables 




:í . * jr.atx* 

ĩ ĩ* 


Pag* 


<c> 


Hình 6.24 (a) Thí dụ về một khuôn dạng địa chỉ ảo (b) Thí dụ về địa chỉ 
ảo (c) Các bảng trang tương ứng với (a) và (b) 

A table 16 entries : báng A với 16 điếm nhập 
B tables 8 entries : các bảng B với 8 điểm nhập 
c tables 4 entries : các báng c với 4 điểm nhập 
Page frame : khung trang 

Kết quả của việc tìm kiếm này là một con trỏ trỏ tới bảng B có 
8 điểm nhập ( bởi vì các trường B của hình 6.24(a) và (b) đều có 3 
bit ). Kế tiếp, các nội dung của trường 5, các bít từ 13 tới 15 ( có giá 
trị nhị phân là 111 ) được dùng như một chỉ số trong bảng B để có 
một cọn trỏ trỏ tới 1 trong 4 điểm nhập của các bảng c. Ta chọn 
điểm nhập 00 chứa một bộ đặc tả trang cho biết số của khung trang 
và một số thông tin khác. Bằng cách kết hợp sô' của khung trang và 
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nội dung của trường OFFSET ta có thể hình thành địa chỉ vật lý 
của byte hoặc từ cần thiết. 

Mặc dù trong thí dụ này ta chỉ dùng 3 mức của của các bảng 
trang, ta vẫn có thế tiếp tục với mức thứ 4 bằng cách có bảng c trỏ 
tới bảng D thay vì trỏ tới một khung trang. Một trường trong mỗi 
điểm nhập của bảng cho biết hoặc bảng trỏ tới một khung trang 
hoặc trỏ tới một bảng khác, và nếu trỏ tới một bảng khác sẽ cho 
biết khuôn dạng điểm nhập nào của bảng mà bảng sử dụng. 

Bảng cuối cùng ( bảng c trong hình 6.24 ) chứa các bộ đặc tả 
trang ( page descriptor ) chứ không phải các con trỏ trỏ tới một mức 
khác chưa có. Hình 6.25 minh họa dạng đơn giản nhất của một bộ 
đặc tả trang. Đặc tả chứa một vùng 24-bit cho số của khung trang. 
Như đã đề cập lúc đầu, trang có kích thước tối thiểu 256 byte. 

Với các trang 256 byte, các offset sẽ có 8 bit vì thế việc kết hợp 
24 bit từ trường PAGE FRAME với offset 8-bit từ đầu cuối bên phái 
của địa chỉ ảo tao ra một địa chí vật lý 32-bit. Với các kích thước 
trang lớn hơn, ta cần ít hơn 24 bit để xác định số của khung trang, 
vì thế một sô' thích ứng của các bit thấp của trường PAGE FRAME 
sẽ không dược sử dụng. 

Bita 24 1111112 


PAGE FRAME 

0 

c 

0 

M 

u 

w 

DT 


0: Cache on ~Ị 
1 : Cache off J 


0: Page is claan _ 

1: Page Isdirty 

0: Page has not been accessedl 
1: Page has been accessed J 

0: Page 18 read/wrlte_ 

1: Page Is read only _ 

0: Invalid entry (trap) 

1: Page desẹrípìor 

2: Next lavel use® ahort Tormat 

3: Next tevel uses long format 


Hình 6.25 Một bộ đặc tả trang của 68030 
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0 : cache on ; 0 : cache mở 
1: cache off: 1 : cache tắt 
0 : Page is clean : 0 : trang sạch 
1 : Page is đirty : 1 : trang dơ 

0 : Page has not been accessed : 0 : trang không được truy xuã*t 
1 : Page has been accessed : 1 : trang được truy xuất 
0 : Page is read / write : 0 : trang có thế đọc / ghi 
1 : Page is read onỉy : 1 : trang chỉ đọc 

0 : Invalid entry ( trap ) : 0 : điếm nhập không hợp lệ ( bẫy ) 

1 : Page descriptor : 1 : bộ đặc tả trang 

2 : Next level uses short format : 2 : mức kê dùng khuôn dạng ngắn 

3 : Next level uses long íbrmat : 3 : mức kế dùng khuôn dạng dài 

Ý nghĩa cùa 5 trường khác như sau. Trường loại dặc tả DT 2-bit 
( descriptor type ) cho biết hoặc điểm nhập này là một bộ đặc tả 
trang ( nghĩa là kết thúc dòng ) hoặc chỉ là một con trỏ khác trỏ tới 
một mức khác chưa có ( và nếu như vậy thì bảng ngắn hay dài ) 
hoặc là một điểm nhập không hợp lệ. 

Bít c được dùng đề không cho phép truy cập nhanh trang được 
trỏ tới. Tiện ích này cẩn thiết đối với các trang chứa các thanh ghi 
cũa thiết bị I/O ánh xạ bộ nhớ. Giả sử rằng việc truy cập nhanh 
không dược phép. Hãy xem điều gì sè xảy ra với một I/O lập trình 
được. Lần đầu một thanh ghi của thiết bị được đọc, thanh ghi sẽ 
được đặt vào cache. Sau đó, các lần dọc kế chỉ phải lấy các từ ra 
khỏi cache, nên những thay đổi trong một bit bất kỳ của thanh ghi 
thiết bị sè không thấy được. Vòng lặp đợi cho một bit thay đổi sẽ 
phải đợi mài mãi. 

Các bít M và Ư được thiết lập bởi phần cứng khi trang bị thay 
đối hoặc vừa được truy xuất. Nhừng bit này được hệ điều hành sử 
dụng để theo dõi các trang sạch và dơ từ đó quyết định xem trang 
nào bị loại bỏ khi cần đến một khung trang. Các bit này được hệ 
điều hành thiết lập lại bằng 0 sau khi chúng được đọc. 

Cuối cùng, bit w được thiết lập để đánh dâu một trang là chỉ 
đọc. Một cố gắng ghi lên trang chỉ đọc sẽ tạo ra một bẫy. 

Giá trị của việc có nhiều mức bảng trang là gì có thể chưa rõ 
ràng nên ta sẽ nêu ra điều này ở đây. Xét một nhóm chương trình 
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dùng chung một cấu trúc dữ liệu lớn. Nếu nhiều điểm nhập trong 
bảng A của các quá trình này đều trỏ tới cùng bảng B, toàn bộ cây 
trang ( page tree ) phía dưới điểm trỏ được dùng chung. Nếu các quá 
trình cũng dùng chung một câu trúc dữ liệu nhò, các bảng c hoặc D 
cũng có thể trỏ tới cùng một trang. Bằng cách sử dụng điều này và 
những đặc tính, kỹ thuật khác của 68030, ta có thể hiện thực được 
các sơ đồ dùng chung phức tạp. 

68030, giông như 80386 và MƯLTICS, có một bộ nhớ kết hợp 
dung lượng nhỏ ( 22 điểm nhập ) trên chip để bó qua báng trang 
nhiều mức trong việc tìm kiếm những trang thường được sử dụng. 
Do có khả năng có rất nhiều tham chiếu bộ nhớ cho mỗi trang được 
tìm, dặc tính này cần thiết để đạt được hiệu suất cao. 

Cho đến đây ta vẫn chưa nói về cách MMU định vị báng A như 
thế nào. Bảng này không được thanh ghi toàn cục trỏ tới, thay vào 
đó là phần cứng duy trì một dãy 8 thanh ghi tương ứng với các 
đường mã chức năng FCx trên các chân ciia chip. Tùy thuộc vào mã 
chức năng, ta có thế chọn một trong 8 bảng A khác nhau để bắt đầu 
tìm kiếm trang. Các bảng này tương ứng với các tham chiếu không 
gian chỉ thị và không gian dừ liệu đối với chương trình hiện tại của 
người sử dụng, tìm nạp không gian chỉ thị và không gian dữ liệu 
đối với hệ điều hành và một không gian địa chỉ đặc biệt đôi với 
việc truyền thông với các bộ đồng xử lý và các thiết bị tương tự. 3 
không gian địa chi khác hiện tại không được sử dụng chúng được 
dự trữ cho các phiên bán trong tương lai của chip. 

Bởi vì phần cứng phân biệt các tham chiếu không gian chỉ thị 
và các tham chiếu không gian dữ liệu, một chương trình trên 68030 
có thể dùng 2 32 byte cho mã và 2 32 byte cho dừ liệu, tống cộng là 2 33 
byte. Khái niệm về không gian chỉ thị và dữ liệu riêng biệt được 
phát minh trên PDP-H/45, trong đó sự khác nhau giừa 64K và 128K 
là quan trọng { làm đầy 64K là điều không khó ). Đôi với 68030, 
không có nhiều chương trình hiện tại bị hạn chế bời giới hạn 2 32 
byte, nhưng rồi đây người ta cũng sẽ nhận thấy rằng kích thước 
chương trình không thể nhỏ được và nhừng người lập trình có thể 
cám ơn ngôi sao may mắn của họ về một không gian địa chỉ được 






Mỉ 444 


Cấu trúc Máy tính 


thêm vào, giông như những người lập trình cho máy PDP-H/45 dã 
làm. 

Một đặc tính mà 68030 không có là các cổng gọi. Một cách tổng 
quát sẽ không an toàn nếu hệ điều hành xuất hiện trong các không 
gian địa chỉ của các chương trình người sử dụng vì chúng có thể 
nhảy đến các địa chỉ tùy ý của hệ điều hành. Tình huông ngược lại, 
việc có các chương trình của người sử dụng xuâT hiện trong không 
gian địa chỉ cùa hệ điều hành lại an toàn và hoàn toàn hợp lý. 

6.1.11 So sánh 80386 và 68030 

Vì 80386 và 68030 cả hai đều được thiết kế gần như dồng thời 
nên việc so sánh 2 chip này là điều thú vị đề xem cách những con 
người khác nhau đi đến nhừng thiết kế khác nhau. Hình 6.26 liệt 
kê một sỏ điểm khác nhau chính giữa 2 sơ đồ quản lý bộ nhớ. Danh 
sách này không đầy đủ do còn có nhiều điểm khác nhau phụ. 


Thành phần 

80386 

68030 

Kích thước không gian địa chỉ ảo { byte ) 

2*5 

2 3:ỉ \ 

Có các không gian dữ liệu và không gian chỉ 
thị riêng ? 

Không 

Có 

Có sự phân đoạn thuần túy ? 

Có 

Không 

Có sự phản trang thuần túy ? 

Có 

Có 

Có sự phân trang và phân đoạn ? 

Có 

Không 

Các bảng trang # cấp 

2 

4 

Kích thước trang 

4K 

256 byte - 32K 

Mỗi trang dều có các bit truy xuất và sửa đổi ? 

Có 

Có 

Kích thước bàng trang 

4K 

Thay đổi 

Có các cổng gọi ? 

Có 

Không 

# mức bao vệ 

4 

* 

2 


Hình 6.26 Một sô điếm khác nhau trong việc quản lý bộ nhớ giữa 80386 và 

68030 
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Điểm khác nhau quan trọng nhất là sự có mặt của một không 
gian địa chỉ được phân đoạn khổng lồ ( 2^-byte ) trên 803086 so với 
một không gian địa chỉ tuyến tính lớn ( 2 32 -byte ) trên 68030 ( 2 33 
byte nếu sử dụng các không gian I &D riêng ). 

Phương pháp phân đoạn cho phép mỗi một đối tượng được quản 
lý và bảo vệ riêng, nhưng lại kèm theo tốn kém thêm cho các con 
trỏ dài hơn. Mặc dù người ta thường phân trang các segment lớn, 
nếu hầu hết các segment đều nhỏ sự chọn lựa để có từng segment 
lưu trừ như một chuỗi byte liên tiếp vẫn tồn tại. Trong bất cứ 
trường hợp nào nếu phải chọn giừa phân đoạn và phân trang, tốt 
hơn là không chọn lựa gì cả. 

Mặt khác trong thực tế, sự phân trang lại quan trọng hơn và 
68030 có sơ đồ phân trang linh động hơn. Việc sử dụng các bảng 
nhiều mức và một kích thước trang lập trình được cho phép những 
nhà thiết kế hệ diều hành diều chỉnh hệ thống cho tải công việc 
của họ và giảm đến mức tôi thiếu sự hao tốn bảng trang. 

Điểm khác nhau quan trọng khác giữa 2 chip là cấu trúc bảo vệ. 
80386 có 4 mức bảo vệ trong khi 68030 chỉ có 2. Các mức phụ thêm 
làm cho chip dễ dàng tách riêng'trình điều khiển gọi hệ thông 
( System call handler ) với lõi của hệ điều hành ( operating System 
kerneỉ ) và cũng dễ dàng hiện thực các thư viện dùng chung hơn. 

Hơn nữa nếu cho phép phân đoạn, ta có khả năng bao gồm cả 
hệ điều hành trong không gian địa chỉ của mọi quá trình của người 
sử dụng ( User process ) để lời gọi hệ thống ( System call ) có thể 
được thực hiện bằng cách gọi một thủ tục ( dùng một cổng gọi ) mà 
không gảy ra một bẫy. Mặc dù đi qua cổng gọi sẽ tốn kém hơn so 
với việc tạo ra một lời gọi thông thường nhưng tối thiểu cũng 
nhanh hơn việc tạo bẫy tới lõi ( kernel ). 

Như sẽ thấy ở phần sau của chương này, hệ điều hành OS/2 cho 
các máy 80286 và 80386 sử dụng phương pháp này nên giảm được 
nhiều chi phí đòi hỏi cho các lời gọi hệ thống. Do bởi thiêu cơ chê 
cổng gọi, không có cách nào để 68030 cho phép các chương trình 
của người sử dụng gọi các chức năng của hệ điều hành được bảo vệ 
mà không tạo ra bẫy đến lõi. Mặt khác hầu hết các hệ điều hành 
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đều không sứ dụng đặc tính này, do vậy sự hiện diện của đặc tính 
này trên 80386 không là một lợi điểm và sự vắng mặt của đặc tính 
này trên 68030 không phải là một trở ngại. 

6.2 CÁC CHỈ THỊ I/O Ảo 

Thông thường tập chỉ thị của cấp 2 hoàn toàn khác với tập chỉ 
thị của cấp 1. Các thao tác mà cả hại có thể được thực hiện và các 
khuôn dạng ciia các chỉ thị của cả hai rất khác nhau. Sự hiện diện 
cứa vài chỉ thị giống nhau trên cả 2 cấp chỉ là tình cờ. 

Tập các chi thị cúa cấp 3 trái lại chứa hầu hết các chỉ thị cua 
cấp 2 cộng thêm vài chỉ thị mới nhưng quan trọng và vài chỉ thị 
gây tốn hại được loại bô. Xuât / nhập là một trong nhiều phạm vi 
trong đó các máy cấp 2 và cáp 3 khác nhau. Lý do của sự khác nhau 
này đơn giản là : những người sử dụng có thể thực thi các chỉ thị 
cấp 2 thật sự, có thế đọc các dữ liệu riêng chứa trong hệ thông, ghi 
lên các thiết bị đầu CUÔĨ của những người sử dụng khác và một cách 
tổng quát có thế tạo ra nỗi phiền toái lớn cho chính họ cũng như đe 
dọa sự an toàn của hệ thông. 

Lý do thứ hai, những người lập trình bình thường và đúng mực 
không muôn tự viết các chương trình I/O riêng cho họ. Tiêu biểu là 
các thanh ghi thiết bị đôi với đĩa điển hình có các bit để phát hiện 
các lỗi. Khi một trong các lỗi xuất hiện, bit tương ứng trong một 
thanh ghi thiết bị được thiết lập. Vài người sử dụng muốn được lo 
lắng theo dõi tất cá các bit lỗi này và các thông tin trạng thái 
khác. 

6.2.1 Các tập tin tuần tự 

Một phương pháp tổ chức I/O ảo là tưởng tượng dừ liệu được đọc 
hoặc ghi như là một chuỗi các bản ghi logic ( logical record ), trong 
đó một bản ghi logic là một đơn vị nào đó của thông tin có nghĩa 
đối với người lập trình. Trong trường hợp đơn giản nhất, một bản 
ghi logic có thể là một ma trận 10 X 10. Với một ứng dụng khác 
bản ghi có thể là một cấu trúc dữ liệu bao gồm 5 thành phần : hai 
chuỗi ký tự “ tên “ và “ người giám sát “ ; hai số nguyên “ phòng “ 
và “ cơ quan “ ; một chuỗi 1-bit “ phái “. Một chuỗi các bản ghi logic 






Chương 6: Cấp máy hệ điều hành 


447 o 


được gọi là một tập tin. Các bản ghi trong 1 tập tin không cần có 
cùng chiều dài, trong trường hợp này chúng được gọi là các bản ghi 
chiều dài thay đổi. 

Chỉ thị nhập ảo cơ bán đọc bản ghi kế từ 1 tập tin đã xác định 
và đặt bản ghi này trong các cell liên tiếp trong bộ nhớ chính ở 
một địa chỉ đã xác định như minh họa trong hình 6.27. Đê thực 
hiện thao tác này, chỉ thị ảo phải trực tiếp hoặc gián tiếp xác định 
(tối thiểu ) 2 thành phần thông tin sau : 

1. Tập tin được đọc 

2. Địa chỉ bộ nhớ chính ở đó bản ghi được đặt vào 

Không có địa chỉ nào trong tập tin được xác định. Các chỉ thị READ 
tuần tự liên tiếp lấy các bản ghi logic liên tiếp từ tập tin. Tình 
huống này tương phản với các tập tin truy xuất ngầu nhiên trong 
phần kế tiếp, trong đó chỉ thị ảo cũng xác định bán ghi logic nào 
được đọc. 

Chỉ thị xuất ảo cơ bản ghi một bản ghi logic từ bộ nhớ lên 1 tập 
tin. Các chỉ thị WRITE tuần tự liên tiếp tạo ra các bản ghi liên tiếp 
trên tập tin. Cũng có 1 chỉ thị ảo REWIND định lại vị trí của tập 
tin ở lúc bắt đầu sao cho bản ghi logic kế tiếp dược đọc hoặc được 
ghi sê là bản ghi đầu tiên. Trình tự thông thường đối với 1 chương 
trình là trước tiên tạo ra 1 tập tin bằng cách ghi một chuỗi các bản 
ghi logic lên tập tin. Sau đó tập tin được quay trờ lại và được đọc 
lại từng bản ghi ở 1 thời điểm. Băng cách này tập tin có thể được 
dùng để chứa nhiều lượng thông tin lớn, rất lớn so với bộ nhớ 
chính. Hơn nữa nếu tập tin được lưu trữ trên băng từ hoặc đĩa từ 
mềm, tập tin có thể được di chuyến đến máy tính khác và được đọc 
ở đó. 

Nhiều hệ điều hành yêu cầu một tập tin phái được mớ trước khi 
được sử dụng, trong trường hợp này một chỉ thị OPEN được cung 
cấp. Chỉ thị OPEN kiểm tra xem có phải người sử dụng được phép 
truy xuất tập tin hay không, nếu có sẽ tìm nạp thông tin về tập tin 
vào bộ nhớ chính, sau đó tập tin được đọc hoặc ghi. Khi một chương 
trình được kết thúc với 1 tập tin, chương trình phải đóng tập tin, 
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(b) 


Hình 6.27 Đọc 1 tập tin tuần tự (a) Trước khi đọc ban ghi ly tb; Sau khi 

đọc bản ghi 19 


Direction of file “motion” : hướng “di chuyển” của tập tin 

Logical record number : số của bản ghi logic 

Next logicaì record to be read : bản ghi kế được đọc 

Main memory : bộ nhớ chính 

Logical record 18 ; bản ghi logic 18 

Buffer : vùng đệm 

1 logical record : 1 bản ghi logic 


Nhiều tập tin có thể được gán thường trực tới các thiết bị 1/0 cụ 
thể. Thí dụ có một tập tin gọi là OƯTPƯT bao gồm 1 dãy các chuỗi 
132-ký tự và được kêt hợp với máy in. Để in một dòng, chương 
trình ở cap 3 ghi một chuỗi 132-ký tự lên tập tin OƯTPUT và bằng 
cách này hay cách khác chuỗi này sau đó xuất hiện trên ngõ ra 
được in. Các chi tiết về các điều đó xảy ra và cách máy in làm việc 
không liên quan đến người lập trình ở cấp 3 mặc dù dì nhiên chúng 
có liên quan rất nhiều đến những người lập trình ở câ'p 2, những 
người phải viết phần mềm thực hiện các chỉ thị ảo ( nghĩa là những 
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người viết hệ điều hành ). 

Một thí dụ khác, ta có 1 tập tin gọi là INPUT chứa các chuỗi 
80-ký tự. Mỗi khi thao tác đọc từ INPƯT được thực hiện, các nội 
dung của thẻ kế tiếp được sao chép vào bộ nhớ.ơ chừng mực mà 
người lập trình ở cấp 3 có liên quan, mỗi một chỉ thị để đọc từ ngõ 
vào làm cho thẻ kế tiếp trong hộp thẻ được đọc. Toàn bộ hộp thẻ có 
thể được đọc cùng một lúc và được lưu trong dĩa cho đến khi cần 
đến, ở điểm này một thẻ được sao chép ở 1 thời điểm vào vùng đệm 
của người sử dụng trong bộ nhớ chính. 

6.2.2 Các tập tỉn truy xuất ngẫu nhiên 

Các tập tin tuần tự đã bàn trên dây không được địa chỉ hóa. 
Một chỉ thị ảo READ đơn giản chỉ đọc bản ghi logic kế tiếp. Chương 
trình không cần cung câp sô của bản ghi logic. Nhiều thiết bị I/O 
như các đầu đọc thẻ chẳng hạn, có bản chã"t tự nhiên là tuần tự. 
Các chỉ thị cấp 3 đọc từ tập tin được kết hợp với đầu đọc thẻ đọc 
thẻ kế tiếp. Chương trình không thể bảo “ Bây giờ hãy đọc thẻ thứ 
427 ” trừ khi đã có 426 thẻ đã được đọc. Một tập tin tuần tự do vậy 
là kiểu mẫu thích hợp với 1 loại thiết bị như vậy. 

Với một sô" ứng dụng, chương trình cần truy xuâ"t các bản ghi 
của một tập tin theo một thứ tự khác với thứ tự mà các bản ghi này 
được ghi. Thí dụ ta hãy khảo sát hệ thông giữ chỗ máy bay trong đó 
danh sách hành khách cho mỗi một chuyên bay hình thành một 
bản ghi logic và tất cả các chuyến bay cho 1 ngày hình thành 1 tập 
tin. Một người có thề gọi cho nhân viên phòng vé và hỏi thăm về 
việc mua một vé trên chuyến bay đến White Plains vào thứ tư tới. 
Nhân viên phòng vé đưa câu hỏi vào thiết bị đầu cuô"i. 

Nếu danh sách hành khách cho chuyên bay đó là bản ghi 26 của 
một tập tin nào đó, chương trình chỉ cần bản ghi 26. Rõ ràng ta 
không nên đọc tuần tự từ đầu, từ bản ghi 1 cho đến khi cố bản ghi 
26. Chương trình cần có khả năng truy xuất một bản ghi cụ thể từ 
phần giữa của 1 tập tin bằng cách cho biết sô" của bản ghi. 

Tương tự đôi khi ta cần ghi lại một bản ghi logic cụ thể trên 
một tập tin mà không phải ghi lại bất kỳ các bản ghi nào trước và 




ỈU 450 


Cấu trúc Máy tính 


sau bản ghi cần ghi. Trong thí dụ trước, một người muôn dành chỗ 
trên chuyên bay đang hỏi thăm. Để thực hiện diều này, chương 
trình phải ghi lại bản ghi logic chứa danh sách dành chỗ, cộng 
thêm tên của người gọi vào danh sách hành khách. Ta không cần 
thiết hoặc không muôn phải thay đổi bất kỳ bản ghi nào khác. 

Hầu hết các hệ điều hành đều cung cấp một chỉ thị ảo để đọc 
bản ghi logic thứ n của một tập tin. Các chỉ thị ảo này phải cung 
câp ( ít nhất ) ba thành phần thòng tin sau : 

1. Tập tin cần đọc 

2. Địa chỉ bộ nhớ chính ở đó bản ghi được đặt vào 

3. Vị trí của bản ghi logic trong tập tin 

Các chỉ thị WRITE tương ứng cũng phải cung cấp các thông tin này. 

Dạng khác của tố chức tập tin là dạng trong đó các bản ghi 
logic được địa chỉ hóa không phải bằng vị trí của chúng trong tập 
tin mà bằng các nội dung của một trường nào đó trong mỗi một bản 
ghi logic, trường này được gọi là khóa. 

Thí dụ một tập tin chứa dữ liệu về nhân viên của một công ty sẽ 
có .một trường trong mỗi bản ghi chứa tên nhân viên. Một chỉ thị ảo 
có thê được cung cấp cho phép chương trình lây tên của một nhân 
viên và có bản ghi của anh ta được đọc vào. Trách nhiệm của hệ 
điều hành là tìm kiếm tập tin chứa bản ghi logic cần đến, người lập 
trình không cần phải viết thú tục tìm kiếm. Tình huống này tương 
tự chỉ thị nhân ở cấp 2, người lập trình không cần phải viết thủ tục 
nhân ( bằng các vi chỉ thị ). 

Trên một sô' máy tính, có sự phân biệt giữa các tập tin được địa 
chỉ hóa bằng số cúa bản ghi hoặc bằng khóa với các tập tin mà chỉ 
có bản ghi kế tiếp được đọc. Các tập tin trước được gọi là các tập 
tin truy xuất ngẫu nhiên để phân biệt với các tập tin sau được gọi 
là các tập tin tuần tự. Trên các máy tính khác, không có sự phân 
biệt như vậy và cả 2 loại chỉ thị ảo ( có và không có định địa chỉ ) 
đều được phép trên mọi tập tin. 
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6.2.3 Hiện thực các chỉ thị 1/0 ảo 

Để hiểu được cách các chỉ thị 1/0 ảo được hiện thực trên máy 
cấp 2, ta cần phải xem xét cách các tập tin được tổ chức và lưu trừ. 
Trong thảo luận sau đây ta giả sử rằng đĩa được dùng để lưu giữ các 
tập tin, tuy nhiên các khảo sát tương tự củng áp dụng cho các 
phương tiện khác. 

Một vấn đề cơ bản phải được giải quyết cho các hệ thống tập tin 
là việc cấp phát vùng luư trữ. Một đĩa bao gồm một chuỗi các 
cyỉinder, mỗi một cylinder có một hay nhiều track, bằng với sô bề 
mặt ( điển hình từ 2 đến 20 ). Các track được chia thành các sector , 
mỗi một sector chứa một sô từ nào đó. Trên một sô đĩa, kích thước 
của sector có thể điều chỉnh. Thí dụ người lập trình có thể chọn để 
tạo khuôn dạng cho một track có 10 sector 600-byte, 12 sector 500- 
byte hoặc 15 sector 400-byte. Trên các đĩa khác, kích thước của 
sector có thể cô định. 

Một dặc tính cơ bản của việc hiện thực một hệ thống tập tin là 
kích thước của đơn vị không gian được cấp phát. Một đĩa có 3 ứng 
viên thích hợp : sector , track và cỵỉinder. Không gian câp phát tính 
bằng đơn vị 2.93 track là điều ngớ ngẩn. Sự khác biệt sè được thấy 
rõ nhất trong trường hợp một tập tin ban đầu chỉ có 1 ký tự. Nếu 
sector là đơn vị cấp phát, chỉ có một sector được dành cho trong tập 
tin và các sector khác trên cùng một track sẽ được sử dụng cho các 
tập tin khác. Nếu track là đơn vị cấp phát, toàn bộ 1 track sè được 
dành chỗ cho tập tin còn các track khác trên cùng một cyỉinder sẽ 
được sử dụng cho các . tập tin khác. Nếu không gian đĩa được cấp 
phát bằng cylinder , toàn bộ cyỉinder sẽ được dành chỗ cho 1 tập tin 
chĩ có 1 ký tự. 

Đặc tính cơ bản khác của việc hiện thực một hệ thông tập tin là 
hoặc tập tin được lưu trữ trong các đơn vị cấp phát liên tiếp hoặc 
không. Hình 6.28 phát họa 1 đĩa đơn giản có một mặt chứa 5 track 
12 -sector. Hình 6.28(a) trình bày một sơ đồ câp phát trong đó sector 
là đơn vị cơ bản của việc cấp phát không gian đĩa và tập tin bao„ 
gồm các sector liên tiếp. Hình 6.28(b) trình bày một sơ đồ cấp phát 
trong đó một tập tin không cần chiếm các sector liên tiếp. 
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Hình 6.28 Các chiến lược cấp phát không gian đĩa (a) Một tập tin trong 
các sector liên tiếp (b) Một tập tin không ớ trong các sector liên tiếp 

Read / write head : đầu dọc / ghi 

Direction of disk rotation : hướng quay của đĩa 

Nêu track là đơn vị cấp phát, một tập tin được cấp phát liên 
tiêp sẽ chiếm các track liên tiếp. Theo qui luật, các track trên một 
cylinder sẽ được câ'p phát trước khi một cylinder kế được cấp phát. 
Nêu một tập tin được câp phát bằng đơn vị track nhưng không liên 
tiếp, các track có thể được chọn bất kỳ nơi đâu trên đĩa, không 
quan tâm đến các track khác. 

Có một khác biệt quan trọng giừa cách mà máy cấp 3 quan sát 
một tập tin với cách mà hệ điều hành quan sát. Các chương trình 
cấp 3 xem tập tin như 1 chuỗi tuyến tính các bản ghi logic, các hình 
ảnh của thẻ, các dòng in và v.v... Hệ điều hành xem tập tin như một 
tập hợp các đơn vị cấp phát liên tiếp và có trật tự ( mặc dù không 
cần thiết). 

Một cách tổng quát, kích thước của bản ghi logic khác với kích 
thưởc của đơn vị cấp phát, có thể nhỏ hơn và cũng có thể lớn hơn. 
Một tập tin có thể chứa một dãy các chuỗi 80-byte chứa trên đĩa với 
không gian được cấp phát tính bằng đơn vị track 16384-byte. Các 
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byte từ 0 đên 79 của track 0 sẽ chứa bản ghi đầu tiên, các byte từ 
80 đến 159 sẽ chứa trong bản ghi thứ hai và v.v... Các track được 
xem như kề nhau về mặt logic cho dù chúng không kề nhau về mặt 
vật lý và một bản ghi logic có thê chia thành 2 track, Đây là công 
việc của hệ điều hành nhằm làm cho kích thước đơn vị câ'p phát vật 
lý trong suốt đôi với chương trình cấp 3. Khi chương trình câp 3 yêu 
cầu bản ghi logic thứ n, hệ điều hành lây bản ghi n và không quan 
tâm đến track nào hoặc các track mà bản ghi có thể chiếm. 

Để hệ điều hành phân phôi bản ghi n của một tập tin nào đó 
theo yêu cầu, hệ điều hành phải có một phương pháp dịnh vị bản 
ghi. Nếu tập tin được cấp phát liên tiếp, hệ điều hành chỉ cần biết 
vị trí bắt đầu của tập tin và kích thước của các bản ghi vật lý và 
logic để tính toán vị trí của bản ghi logic. Thí dụ nếu một bản ghi 
logic có 8 từ và 1 trouck có 100 sector 64-từ, bản ghi logic 5000 sẽ ơ 
trong sector 25 của track 6. Từ việc biết vị trí của track đầu tiên, 
phần mềm cấp 2 có thể tính toán chính xác địa chỉ trên đĩa của 
sector đang cần và phát 1 lệnh cho đĩa để đọc. 

Nếu tập tin không được cấp phát liên tiếp, không thể tính vị trí 
của một bản ghi logic tùy ý từ vị trí bắt dầu của tập tin. Để định vị 
một bản ghi logic tùy ý, ta cần một bảng gọi là bảng chỉ số tập 
tin ( fìle index ) cho biết các đơn vị cấp phát và các địa chỉ trên đĩa 
thực sự được cần đến của chúng. Bảng chỉ sô" tập tin có thể được tổ 
chức hoặc theo các bản ghi logic cho biết địa chỉ trên đĩa của từng 
bản ghi hoặc đơn giản như là một danh sách các đơn vị cấp phát và 
các địa chỉ trên đĩa của chúng. Để minh họa cách sử dụng bảng chỉ 
số tập tin, ta hãy khảo sát một đĩa có đơn vị cấp phát là sector như 
ở hình 6.28(b) với 512 byte cho một sector. Tập tin có các bản ghi 
logic 132-byte ( các dòng in ) với các byte từ 0 đến 131 tạo thành 
bản ghi logic 0, các byte từ 132 đến 263 tạo thành bản ghi logic 1 
và v.v... Bản ghi logic 21 chiếm các byte từ 2772 đến 2903 ở sector 5. 
Bằng cách sử dụng bảng chỉ sô" tập tin, hệ điều hành có thể tìm 
kiếm địa chỉ của sector được yêu cầu. 

Một phương pháp khác để dịnh vị các đơn vị câp phát của 1 tập 
tin là tổ chức tập tin như một danh sách liên kết ( linked list ). Mỗi 
đơn vị cấp phát chứa dịa chỉ của đơn vị kế sau. Điều này có thể 
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thực hiện một cách có hiệu quả nhâ't nếu phần cứng cung cấp thêm 
một từ cho mỗi đơn .vị cấp phát để lưu trữ địa chỉ này. Phương pháp 
này tương đương với sự phân tán bảng chỉ sô' tập tin trên toàn bộ 
tập tin. Trên một đĩa mà đơn vị câp phát là sector , mỗi sector chứa 
địa chỉ của sector kê sau. Một tập tin trên đĩa như vậy chỉ có thể 
được dọc tuần tự, không thể truy xuất ngẫu nhiên được. 

Cho đến đây cả 2 loại tập tin, tập tin được cấp phát liên tiếp và 
tập tin không được câp phát liên tiếp đã được bàn đến nhưng chúng 
ta chưa xác định rõ tại sao cả 2 loại này đều được sử dụng. Người sử 
dụng tạo ra một tập tin dôi khi biết được kích thước tối đa mà tập 
tin sẽ đạt tới sau này nhưng đôi khi lại không biết. Hãy khảo sát 
hệ thông thanh toán được máy tính hóa của Ecology Manuĩacturing 
Company vừa thông báo sản phẩm mới nhất của công ty này, bàn 
chải đánh răng. Các máy tính của công ty có tập tin ghi danh sách 
tên và địa chỉ của tất cả các khách hàng nhưng ồ thời điểm bàn 
chải đang được bán, các máy tính không biết cuối cùng chúng có 
bao nhiêu khách hàng nên chúng không biết tập tin khách hàng 
cuối cùng sẽ lớn bao nhiêu. 

Khi kích thước cực đại của tập tin không được biết trước, thường 
ta không thể sử dụng tập tin được cấp phát liên tiếp. Nêu tập tin 
bắt đầu ở track j và được phép lớn dần trong các track liên tiếp, tập 
tin có thể chạm vào một tập tin khác ở track k và không có cửa sổ 
để phát triển. Nếu tập tin được cấp phát không liên tiếp, tình 
huống này không xảy ra do các track kế sau có thể được đặt ở một 
cylinder bất kỳ. Nếu một đĩa chứa nhiều tập tin “ lớn dần “, không 
có tập tin nào có kích thước cuôì cùng được biết, việc lưu trữ từng 
tập tin này như là một tập tin được cấp phát liên tiếp không thể 
thực hiện được. Việc di chuyển một tập tin đang hiện hữu đôi khỉ 
thực hiện được nhưng chi phí luôn luôn đắt. 

Nếu kích thước cực đại của tập tin được biết trước, một vùng của 
đĩa có thể được cấp phát khi tập tin được tạo ra dù rằng dữ liệu 
chưa có. Thí dụ dữ liệu thời tiết hàng ngày của năm 1991 sè yêu 
cầu 365 bản ghi logic và có thể được cấp phát trước 31 tháng 12 
năm 1990 dù rằng không có dừ liệu nào được biết ở thời điểm tạo 
ra tập tin. Các tập tin được câ'p phát liên tiếp ít linh dộng hơn các 
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tập tin không được câp phát liên tiếp do bởi kích thước cực đại của 
chúng phải được biết trước hay nói cách khác việc hiện thực chúng 
đơn giản hơn do chúng không cần bảng chỉ số tập tin. Chú ý là cả 2 
loại tập tin, tập tin được cấp phát liên tiếp và tập tin không được 
cấp phát liên tiếp, đều có thể được sử dụng như là các tập tin truy 
xuất tuần tự và các tập tin truy xuất ngẫu nhiên. 

Để cấp phát không gian trên đĩa cho một tập tin, hệ điều hành 
phải theo dõi các đơn vị cấp phát nào được dùng và các đơn vị cấp 
phát nào đã được dùng cho các tập tin khác. Một phương pháp là 
duy trì một danh sách tất cả các lỗ trông, một lỗ có một sô' đơn vị 
cấp phát nào đó. Danh sách này được gọi là danh sách trông ( free 
list ). Hình 6.29(a) minh họa danh sách trống cho đĩa cùa hình 
6.28(b). 
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Hình 6.29 Hai cách theo dõi track của các sector (a) Danh sách trông (b) 

Bản dồ bit 

Number of sectors in hole : số các sector trong lỗ trống 

Một phương pháp khác là duy trì bản đồ bit với một bít cho mỗi 
đơn vị cấp phát như trình bày trong hình 6.29(b). Bit 1 chỉ ra rằng 
đơn vị cấp phát đã được chiếm và bit 0 cho biết dơn vị cấp phát còn 
có giá trị ( chưa bị chiếm ). 

Phương pháp đầu tiên có lợi điểm là dễ dàng tìm thấy một lỗ 
trông với chiều dài cụ thể nhưng lại có điểm bất lợi là danh sách có 
kích thước thay đổi. Khi các tập tin được tạo ra và được hủy đi 
chiều dài của danh sách sẽ biến động, một đặc điểm không mong 
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muốn. Bản đồ bit có lợi điểm là có kích thước cô" định. Hơn nữa, 
việc thay đối tình trạng của một đơn vị cấp phát từ có giá trị sang 
bị chiếm chỉ là vấn đề thay đổi 1 bit. Tuy nhiên việc tìm một khôi 
có kích thước cho trước sẽ khó khăn. Cả 2 phương pháp đều yêu cầu 
khi có một tập tin bất kỳ được cấp phát hoặc trả về, danh sách 
hoặc bản đồ phải được cập nhật. 

Trước khi kết thúc chủ đề hiện thực hệ thông tập tin, ta cũng 
nên ghi chú về kích thước của đơn vị câp phát. Vài tập tin sẽ chiếm 
chính xác một sô nguyên của sô" đơn vị cấp phát, tuy nhiên một 
không gian nào đó sẽ bị bỏ trông trong đơn vị câ"p phát cuối cùng 
đối với hầu hết các tập tin. Nếu tập tin lớn hơn nhiều so với đơn vị 
cấp phát, không gian trung bình bị bỏ phí sẽ là Vố đơn vị cấp phát. 
Đơn vị cấp phát càng lớn, càng có nhiều không gian trông bỏ phí 
hơn. 

Nếu kích thước một tập tin được kỳ vọng là ngắn, sè không có 
hiệu quả khi cấp phát không gian đĩa bằng các đơn vị cấp phát lớn. 
Thí dụ nếu hầu hết những người sử dụng một hệ thông tập tin là 
các sinh viên với các chương trình ngắn trung bình khoảng 3000 ký 
tự, và một track của đĩa chứa 100 sector 640-ký tự, sẽ rất dại dột 
nếu câp phát không gian đĩa bằng các đơn vị câp phát là track hoặc 
tệ hơn, đơn vị câ"p phát là cylinder. 

Một bất lợi của việc cấp phát không gian bằng các chunk nhỏ là 
bảng chỉ số tập tin và bản đồ bit sẽ lớn. Hơn nữa nếu tập tin được 
cấp phát không liên tiếp, trong trường hợp tổng quát,.ta sẽ phải 
tìm kiếm trên từng đơn vị cấp phát nên việc tìm kiếm trên đĩa sẽ 
chậm. Việc phải tìm kiếm từng 640 ký tự sè ít được mong nuốn hơn 
việc tìm kiếm từng 64000 ký tự. 

6.2.4 Các chí thị quản lý thư mục 

Trước đây vào những ngày đầu của máy tính, người ta giử các 
chương trình và dữ liệu trên các thẻ đục lồ trong các văn phòng. 
Khi các chương trình và dữ liệu tăng kích thước và số lượng, tình 
huống này ngày càng ít dược mong muốn. Điều này cuối cùng dẫn 
đến ý tưởng sử dụng bộ nhớ phụ của máy tính ( như là đĩa từ ) như 
là một vùng lưu trừ cho các chương trình và dữ liệu. Thông tin có 
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thể được truy xuât trực tiếp bởi máy tính mà không cần đến sự can 
thiệp của con người được gọi là thông tin trực tuyến ( on-line ), trái 
với thông tin không trực tuyến ( oíĩ-line ) cần có sự can thiệp của 
con người ( đọc một hộp thẻ ) trước khi máy tính có thể truy xuất. 

Thông tin trực tuyến được lưu trữ dưới dạng các tập tin, các 
chương trình truy xuất thông tin qua các chỉ thị xuất / nhập tập tin 
đã bàn đến ở các mục 6.2.1 và 6.2.2. Tuy nhiên vần cần có thêm 
nhiều chỉ thị nữa dể theo dõi thông tin trực tuyến được lưu trữ, tập 
hợp chúng thành các đơn vị thích hợp và bảo vệ chúng khỏi những 
sử dụng không được phép. 

Cách thông thường cho hệ điều hành để tổ chức các tập tin trực 
tuyến là nhóm chúng vào trong các thư mục ( directory ). Hình 6.30 
trình bày một thí dụ về tô chức thư mục. Các chí thị câp 3 dược 
cung cấp với các chức năng tối thiều sau : 

1. Tạo 1 tập tin và dưa tập tin này vào một thư mục 

2. Xóa một tập tin khỏi một thư mục 

3. Đổi tên tập tin 

4. Thay đối trạng thái bảo vệ của tập tin 

Có nhiều sơ đồ bảo vệ khác nhau đang được sử dụng. Sơ đồ đơn 
giản nhất là mỗi một tập tin có một mật khẩu ( secret passvvord ) 
riêng. Khi có một thao tác truy xuất tập tin, một chương trình phải 
cung cấp mật khẩu và hệ điều hành sẽ kiểm tra xem có đúng mật 
khẩu hay không trước khi cho phép truy xuất. Một phương pháp bảo 
vệ khác là cung cấp cho tập tin một danh sách rõ ràng những người 
mà các chương trình của họ có thề truy xuât tập tin này. 

Hầu hết các hệ điều hành cho phép những người sử dụng duy trì 
nhiều hơn một thư mục. Bán thân mỗi thư mục là một tập tin và 
như vậy có thể được liệt kê trong một thư mục khác và phát triển 
dần thành cây thư mục ( directory tree ). Các da thư mục thường 
đặc biệt hữu ích đối với những người lập trình làm việc trên một sô 
đề án. Họ có thể nhóm tất cả các tập tin có liên quan với nhau 
trong 1 đề án vào một thư mục. Trong khi dang làm việc trong thư 
mục đó, họ sẽ không bị rô'i trí bởi các tập tin không liên quan. Các 
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thư mục cũng là một phương pháp thích hợp để dùng chung các tập 
tin với các thành viên khác cua một nhóm. 
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File namc; 

Rubber-ducky 

Length: 

1840 


Týpe: 

Pascal program 1 

Creation date: 

March 16, 1066 

Last access: 

September 1,1492 

Last change: 

July 4, 1776 

Total accesses: 144 

Block 0: 

Track 4 

Sector 6 

Block 1: 
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Block 3: 
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Hình 6.30 (a) Một thư mục của người sử dụng (b) Nội dung cúa một điểm 

nhập tiêu biểu trong 1 thư mục 

File name : tên tập tin 
Length : chiều dài 
Type : loại 

Creation date : ngày tạo lập 
Last access : lần truy xuất cuối cùng 
Last change : lần thay đối cuối cùng 
Total accesses : tống sô lần truy xuất 
Bỉock 0 : khối 0 

6.3 CÁC CHỈ THỊ Ảo DÙNG TRONG xử LÝ SONG SONG 

Một số tính toán cỏ thể được lập trình một cách thích hợp nhất 
cho hai hay nhiều quá trình ( process ) cùng hoạt động song song 
( đồng thời trên các bộ xừ lý khác nhau ), không phải cho một quá 
trình đơn. Các tính toán khác có thê được chia thành nhiều mảng, 
sau đó các mảng này dược thực hiện song song để giảm thời gian 
trôi qua cần có cho toàn bộ tính toán. Để cho vài quá trình cùng 
làm việc song song, thêm nhiều chỉ thị ảo cần dùng. Các chỉ thị này 
được thảo luận trong các phần sau. 
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Các định luật về vật lý chưa cung cáp một lý do nào khác đôi 
với lợi ích hiện nay trong xử lý song song. Theo thuyết tương đôi 
của Einstein, ta không thể truyền các tín hiệu điện với vận tốc 
nhanh hơn vận tốc của ánh sáng, gần 1 ft/nsec. Giới hạn này có 
liên quan mật thiết đến việc tố chức một máy tính. Thí dụ nếu một 
CPU cần dữ liệu từ bộ nhớ chính cách xa 1 ft, ta phải mất ít nhất 1 
nsec cho yêu cầu gời đến bộ nhớ và 1 nsec khác cho trá lời đến 
CPU. Hậu quả là các máy tính có thời gian dưới nanosec sẽ có kích 
thước cực kỳ nhỏ. Một phương pháp khác để tăng tốc độ các máy 
tính là xây dựng máy có nhiều CPU. Một máy tính với 1000 CPU 
1 nsec có cùng công suất tính toán với một CPU có thời gian 1 chư 
kỳ là 1/1000 nsec, nhưng máy đầu dễ thiết kế và rẽ hơn nhiều so 
với máy sau. 

Trên một máy tính có nhiều hơn một bộ xử lý vật lý, mồi một 
trong nhiều quá trình cùng làm việc có thể được gán cho một bộ xử 
lý riêng, cho phép các quá trình được tiến hành đồng thời. Nếu chỉ 
sử dụng một bộ xử lý vật lý, việc xử lý song song có thể được mô 
phỏng bằng cách cho bộ xứ lý chạy lần lượt từng quá trình trong 
các khoảng thời gian ngắn. Nói cách khác bộ xử lý có thể được 
dùng chung giữa nhiều quá trình với nhau. 

Hình 6.31 trình bày sự khác nhau giữa xử lý song song thực sự 
với nhiều hơn một bộ xử lý vật lý và xử lý song song được mỏ 
phỏng chỉ có một bộ xử lý vật lý. Ngay cả khi một xử lý song song 
được mô phỏng, người ta thường xem mỗi quá trình như thể có một 
bộ xử lý ảo riêng. Các vấn đề truyền thông tương tự nảy sinh khi có 
xử lý song song thực sự cũng nảy sinh trong trường hợp được mô 
phỏng. 

6.3.1 Tạo quá trình 

Khi một chương trình được thực thi, chương trình phải chạy như 
là một phần của quá trình nào dó. Quá trình này, giông như mọi 
quá trình khác, được đặc trưng bởi một trạng thái và một không 
gian địa chỉ qua đó chương trình và dừ liệu được truy xuất. Trạng 
thái bao gồm bộ đếm chương trình và có thể một từ trạng thái 
chương trình, một con trỏ và các thanh ghi tổng quát. 
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(a) 


Process3 


Process 2 


Procesa 1 


Proceas 3 walting for CPU 
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ỉ 


Process 1 running 


Time 

<b> 


Hình 6.31 (a) Xử lý song song thực sự với nhiều CPU (b) Xử lý song song 
được mô phỏng bằng cách chuyển đổi một CPU cho các quá trình 

Process 1 : quá trình 1 
Time : thời gian 

Process 1 running : quá trình 1 đang chạy 

Process 3 vvaiting for CPU : quá trình 3 đang chờ CPU 


Các hệ điều hành đơn giản thường hỗ trợ một số quá trình cố 
định, tất cả quá trình được tạo ra khi máy tính được khởi động và 
mất đi khi máy tính ngừng hoạt động. Trên nhiều máy tính một 
chương trình phải chờ trong hàng đợi ngõ vào cho đến khi một quá 
trình trớ thành có giá trị trước khi quá trình được nạp vào không 
gian địa chỉ của quá trình và dược thực thi. 

Nhiều hệ điều hành phức tạp hơn cho phép các quá trình được 
tạo ra và kết thúc mà không phải ngừng máy tính. Một máy tính có 
loại hệ điều hành này có thể hỗ trợ một số thay đổi máy cấp 3, mỗi 
quá trình tương ứng với một máy ảo. Để có được đầy đủ thuận lợi 
của quá trình song song, một chương trình cấp 3 cần một chỉ thị ảo 
để tạo các quá trình mới có thể giao phó công việc. Một số hệ điều 
hành cung cấp một chỉ thị cấp 3 để tạo một quá trình mới, cho 
phép quá trình tạo ( creating process ) xác định trạng thái ban đầu 
của quá trình mới bao gồm chương trình, dữ liệu và địa chỉ bắt đầu. 
Với một số hệ thống lập trình của IBM 370, một thủ tục có thể gọi 
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một thủ tục khác theo cách riêng sao cho có thủ tục gọi và thủ tục 
bị gọi chạy song song như là các quá trình riêng rẽ. 

Trong một sô' trường hợp, quá trình tạo { cha ) duy trì toàn bộ 
điều khiển trên quá trình được tạo ( con ). Các chỉ thị ảo tồn tại để 
quá trình cha dừng, khởi động, khảo sát và kết thúc các quá trình 
con. Trong các trường hợp khác, quá trình cha ít điều khiển các quá 
trình con ; một khi 1 quá trinh đã được tạo ra, không có cách nào 
quá trình cha ép buộc quá trình con dừng, khởi động, khảo sát và 
kết thúc. Hai quá trình sau đó chạy độc lập với một quá trình khác. 

6.3.2 Các điều kỉện tranh đua 

Trong phần, này các khó khăn phát sinh trong các quá trình 
song song đồng bộ sẽ được giải thích bằng một thí dụ chi tiết. Một 
giải đáp cho các khó khăn này sẽ được đưa ra trong phần tiếp theo 
sau. Ta hãy khảo sát một tình huống có 2 quá trình độc ỉập, quá 
trình 1 và quá trình 2, truyền thông thông qua một vùng đệm dùng 
chung trong bộ nhớ chính. Để đơn giản chúng ta sẽ gọi quá trình 1 
là producer và quá trình 2 là consuĩner. Producer tính các sô' 
nguyên tố và đặt chúng vào vùng đệm từng số một. Consumer lấy 
chúng ra khỏi vùng đệm từng sô' một và in chúng. 

Hai quá trình này chạy song song ở các tô'c độ khác nhau. Nếu 
producer khám phá ra vùng đệm đầy, quá trình này sè ngủ nghĩa là 
quá trình tạm thời treo để chờ một tín hiệu từ consumer. Sau đó 

khi consunier đã di chuyển một sô' khỏi vùng đệm, quá trình này 

gởi một tín hiệu dê’ đánh thức producer , nghĩa là khởi động lại 
producer, Tương tự nếu consumer khám phá ra vùng đệm rỗng, quá 
trình này sẽ ngủ. Khi producer đặt một sô' vào vùng đệm rồng, 
producer đánh thức consumer đang ngủ. 

Trong thí dụ này, chúng ta sẽ sử dụng một bộ đệm xoay vòng 
cho việc truyền thông liên quá trình. Các con trỏ in và out sẽ được 
dùng như sau : in trỏ tới từ trông kế ( nơi producer sè đặt sô 

nguyên tố kê tiếp ) và out trỏ tới sô' kê' sẽ được di chuyền bơi 

consumer. Khi ỉn = out, bộ đệm rồng như trình bày trong hình 
6.32{a). Sau khi producer tạo ra một sô' các sô' nguyên tô', tình 
huống sẽ như trong hình 6.32(b). Hình 6.32(c) minh họa bộ đệm sau 
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khi consumer di chuyển một sô' trong các sô" nguyên tô" này và 
in ra. Hình 6.32(d) - (f) phác thảo hoạt động xoay vòng của bộ đệm, 
đỉnh của bộ đệm kề với đáy theo nghĩa logic. Khi xảy ra hiện tượng 
xoay vòng, in bây giờ đi sau outy hiện tượng đầy xảy ra khi ỉn và 
out cách nhau một từ. Từ này không thể sử dụng vì nếu không, ta 
sẽ không có cách nào biết vùng đệm đầy hay rỗng khi in - out. 

Hình 6.33 trình bày một sô" khai báo và các thủ tục được sử 
dụng bởi producer và consumer ở dạng giả Pascal. Pascal không cho 
phép xử lý song song do vậy chúng ta đã phát minh 2 thủ tục “ thư 
viện “ : sleep , thủ tục làm cho quá trình ngủ và ivakeup , thủ tục* 
đánh thức quá trình. Sau khi khới động (in - 1 và out = 1 ), 
producer và consumer sẽ được bắt đầu song song. 

Sau khi producer tìm ra sô nguyên tô" kế tiếp ở phát biểu Pl, 
quá trình này kiểm tra ( ở P2 ) xem có phải ỉn đi sau out một từ 
hay không. Nếu có, vùng đệm đầy và producer sẽ ngủ. Nếu vùng 
đệm không đầy, sô" nguyên tố mới được chèn vào vùng đệm ( P3 ) 
và in được tăng ( P4 ). Nếu giá trị mới của in đi trước giá trị của 
out là 1 ( P5 ), ỉn và out phải bằng nhau trước khi in được tăng. 
Producer kết luận rằng vùng đệm rỗng và consumer đang còn ngủ. 
Producer sẽ gởi một tín hiệu đánh thức consumer. Cuối cùng, 
producer bắt đầu việc tìm kiếm sô" nguyên tố mới. 


In, out 


(a) 



Hình 6.32 Cách sứ dụng vùng đệm xoay vòng 
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const MaxPrime =...; 

BufSize= 100; 

typ eindex= 1... BufSize; 

var in: index; 
out: index ; 

butter: array [index] of integer; 

tunctlon nexí (k: index): index,- 
{Compute ỉhe successor to k taking wraparound 

begln 

ff k < BufSize then next: - k + 1 else next: = 1 
end: {next} 


{largest prime to look for} 

{number of buíter slots} 

{buffer slots numbered from 1 to BufSize} 

{next free Slot for a prime to go into} 

{next prime to be íetched and printed} 
{shared buffer} 


into account} 


procedure producer; 

{The producer computes prime numbers and puts them in a shared buffer for 
subsequent printing. When the buffer is tutl, the producer goes to sleep. 

When the consumer sendaa wakeup signat. the producer continues at P3}. 

var prime: integer; 
begin 

prime: = 2; 

while príme < MaxPrime do 

begln 

{P1} ComputeNextPrime (prime) 

{P2} lf next (in) = out then s/eep: 

{P3> butter [/n]: = pr/me; 

{P4} in: = next (in); 

{P5> II next (out) = in then wakeup (consumer) 

end 

end; {producer} 


procedure consumer; 

{The consumer takes numbers out of the buffer and prints them. If the buHer 
becomes empty, the consumer goes to sleep. When the producer sends a wakeup 
sígnal, the consumer continues at C2} 
var emirp: integer; 
begln 
emirp: = 2; 

while emirp < MaxPrime do 

begin 

{C1} II in= oưf then sleep; 

{C2> emirp: - butter [ouí] 

{03} out: = next (out) 

{04} if out= next (next (in)) then wakeup (producer); 

{05} rniteln (emirp) 

end 

end: {consumer} 


Hình 6.33 Xử lý song song có điều kiện tranh đua tai hại 
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Chương trình của consumer cũng có cấu trúc tương tự. Trước tiên 
một kiểm tra được thực hiện ( C1 ) để xem vùng đệm có rỗng hay 
không. Nếu có, không có việc gì dể consumer làm do vậy quá trình 
này sè ngủ. Nếu vùng đệm không rỗng, consumer di chuyển sô" kế 
tiếp đế in ( C2 ) và tăng out ( C3 ). Nếu out theo sau in 2 từ ở thời 
điểm này { C4 ), out sẽ ở vị trí theo sau in 1 từ trước khi được tăng. 
Bởi vì đây là điều kiện đề “ vùng đệm đầy producer phải dang 
ngủ và do vậy consumer gới tín hiệu đánh thức producer . Cuối cùng 
sỏ" dược in ra ( C5 ) và chu kỳ lập lại. 

Không may thiết kê này lại chứa một sai lầm rất tai hại như 
trình bày trong hình 6.34. Nên nhớ rằng 2 quá trình này chạy 
không đồng bộ và ở các tốc độ khác nhau, có thề thay đổi. 

Ta hãy khảo sát trường hợp trong đó chỉ có một sô" còn lại trong 
vùng đệm, trong từ 21 và in = 22, ouí = 21 như trong hình 6.34(a). 
Producer ở phát biểu P1 dang tìm kiếm một sô" nguyên tô và 
consumer đang bận ở C5, in sô ở vị trí 20. Consumer kết thúc việc 
in số, thực hiện kiểm tra ở Cl và lây số cuôi cùng ra khỏi vùng đệm 
ở C2 sau dó tăng out. Vào lúc này, in và out đều có giá trị 22. 
Consumer in sô và tiếp tục ở Cl, ở đó consumer tìm nạp in và out 
từ bộ nhớ đê so sánh chúng như ở hình 6.34(b). 

Ngay lúc này, sau khi consumer tìm nạp ỉn và out nhưng trước 
khi consunier so sánh chúng, producer tìm thấy một số nguyên tố 
mới. Producer đặt sô" nguyên tô' này vào vùng đệm ở P3 và tăng ỉn 
ở P4. Bây giờ in - 23 và out = 22. Ở P5, producer khám phá 
ra in = next ( out ). Mặt khác in cao hơn out 1 từ, đồng nghĩa với 
bây giờ có 1 phần tử trong vùng đệm. Do vậy producer kết luận 
t sai ) rằng consumer đang ngủ nên gời một tín hiệu đánh thức 
consumer như trong hình 6.34(c). Dĩ nhiên consumer dang thức và 
tín hiệu đánh thức bị mất. Producer bắt đầu tìm kiếm số nguyên 
tố mới. 

Consumer tiếp tục đúng vào thời điểm này. Consumer đã tìm 
nạp ỉn và out từ bộ nhớ trước khi producer đặt sô" cuối cùng vào 
vùng đệm. Bới vì cả 2 đều bằng 22 nên consumer ngủ. Bây giờ 
producer tìm thấy số nguyên tố khác. Producer kiểm tra con trỏ và 
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thấy ỉn = 24, out - 22 nên producer giả thiết rằng có 2 số trong 
vùng đệm ( đúng ) và consumer đang thức ( sai ). Producer tiếp tục 
Jtìm và cuối cùng làm dầy vùng đệm và bắt đầu ngủ. Cả 2 quá trình 
đều ngủ và sẽ duy tri như vậy mãi mãi. 


Out= 21 
ln= 22 


Producer at P1 
consumar at cs 



<a> 


_ .__ ProcỊucer at P5 

Producer at P1 sends wafce-up 

consumer at C1 consumer at C1 


1 


1 


Out= ln= 22-► 


Out= 22-► 

Prlme 



ln= 23-► 



BuKer 


1 number 


empty 


In buffer 

100 


100 



(b) (c) 


Hình 6.34 Thất bại cũa cơ chế truyền thông producer-consumer 

Producer at Pl, consumer at C5 : producer ở Pl, consumer ở C5 
Prime : số nguyên tố 
1 number in buíĩer : 1 số trong vùng đệm 
BuíTer empty : vùng đệm rỗng 

Producer at P5 sends wake-up consumer at Cl : producer à P5 gới tín hiệu 
đánh thức consttmer ờ C1 

Khó khăn ở đây là giữa thời điểm khi consumer tìm nạp in và 
outy và thời điểm consumer đi ngủ producer khám phá ra 
in = out + 1, giả thiết rằng consumer đang ngủ và gởi một tín hiệu 
đánh thức nhưng bị mâ't do consumer vần đang thức. Khó khăn này 
được biết đến như là một điều kiện tranh đua ( race condition ), do 
bởi thành công của phương pháp này phụ thuộc vào người thắng sự 
tranh đua để kiểm tra ỉn và out sau khi out được tăng. 
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6.3.3 Đồng bộ các quá trình bằng semaphore 

Điều kiện tranh đua có thề được giải quyết ít nhất bằng 2 cách. 
Một giải pháp bao gồm việc trang bị cho mỗi một quá trình một bit 
chờ đánh thức ( wake-up vvaiting bit ). Mỗi khi có một tín hiệu đánh 
thức được gới tới một quá trình mà quá trình này vẫn đang chạy, 
bit chờ đánh thức cùa quá trình được thiết lập là 1. Mỗi khi quá 
trình đi ngủ trong khi bit chờ đánh thức là 1, ngay lập tức quá 
trình được khới động lại và bít này được xóa về 0. Bit chờ đánh 
thức lưu trữ tín hiệu đánh thức thừa ( không cần thiết ) dể dùng sau 
này. 

Mặc dù phương pháp này giải quyết được điều kiện tranh đua 
khi chỉ có 2 quá trình, nhưng sẽ thất bại trong trường hợp tổng 
quát có n quá trình truyền thông nhau do bởi có đến ( n — 1 ) tín 
hiệu đánh thức phái được cất. Dĩ nhiên mỗi quá trình có thể được 
trang bị ( n - 1 ) bit chờ đánh thức nhưng giải pháp này lại vụng 
vê. 

Dijkstra ( 1968b ) đề nghị một giải pháp tổng quát hơn cho vấn 
đề đồng bộ các quá trình song song. Một nơi nào đó trong bộ nhớ có 
2 biến sô' nguyên không âm gọi là semaphore. Các chỉ thị cấp 3 
thao tác trên các semaphore, ƯP và DOWN, được cung cấp bởi hệ 
điều hành. UP cộng 1 cho một semaphore và DOWN trừ 1 cho một 
semaphore. 

Nêu một chí thị DOWN được thực hiện trên một semaphore lớn 
hơn 0, semaphore được giảm bời 1 và quá trình đang thực hiện 
DOWN tiêp tục. Tuy nhiên nếu semapìiore là 0, DOWN không thể 
hoàn tất, quá trình đang thực hiện DOWN được cho đi ngủ và duy 
trì giấc ngủ cho tới khi một quá trình khác thực hiện UP trên 
semaphore đó. 

Chỉ thị UP kiểm tra xem có phải semaphore bằng 0 hay không. 
Nếu bằng 0 và quá trình khác đang ngủ trên semaphore này, 
semapỉiore dược tăng 1. Quá trình đang ngu sau đó có thể hoàn tất 
thao tác DOWN đang treo quá trình, thiết lập lại semaphore bằng 0 
và cho phép cả 2 quá trình được tiếp tục tính toán. Một chỉ thị UP 
trên một semaphore khác 0 chỉ đơn giản tăng semaphore lên 1. 
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Semaphore cung cấp một bộ đếm để lưu giữ các tín hiệu đánh thức 
để dùng về sau, sao cho chúng không bị mất mát. Một đặc tính chũ 
yếu của các chỉ thị semaphore là một khi một quá trình đã khởi 
động một chỉ thị trên một semaphore , không có quá trình nào khác 
có thể truy xuất semaphore cho tới khi quá trình đầu tiên hoặc đã 
hoàn tất chỉ thị hoặc bị treo khi thử thực hiện một DOWN trên một 
semaphore bằng 0. Hình 6.35 tóm tắt các đặc tính chú yếu cúa các 
chỉ thị UP và DOWN. 


Giá trị cùa semaphore trước chỉ thị 


Chỉ thị 

Semaphore = 0 

Semapỉiore > 0 

ƯP 

Semaphore = semapỉiore + 1 

Semaphore = semaphore + 1 


Nếu quá trình khác đâ bị dừng 
khi thử hoàn tất chỉ thị DOWN 



trên semaphore này, quá trình 
đó bây giờ hoàn tất chỉ thị 
DOWN và tiếp tục chạy 


DOWN 

Quá trình dừng cho đến khi một 
quá trình khác ƯP semapìiore 
này 

Semaphore - semuphore — 1 


Hình 6.35 Kết quá cúa một chỉ thị semaphore 


Hình 6.36 trình bày cách thức điều kiện tranh đua bị loại bỏ 
thông qua cách sử dụng các seniaphore. Hai semaphore được sử 
dụng, available có giá trị bắt đầu là 100 ( kích thước vùng đệm ) và 
fúled có giá trị bắt đầu là 0. 

Producer bắt đầu thực thi ở P1 và consumer bắt đầu thực thi ở 
Cl trong hình 6.36. Chỉ thị DOWN trên filled dừng bộ xử lý của 
consumer ngay tức khắc. Khi producer tìm thây số nguyên tô' đầu 
tiên, producer thực thi chi thị DOWN trên avaiỉablc làm cho giá trị 
của available là 99. ơ P5, producer thực hiện một ƯP trên ỷĩỉỉed 
làm cho ỷĩlLed bằng 1. Hành động này giải phóng consumer , 
consumer bây giờ có thể hoàn tất chỉ thị DOWN. ơ thời điểm này 
fúled bằng 0 và cả 2 quá trình đang chạy. 
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const MaxPnme =...; 
BufSize= 100; 

type index= 1... BufSize; 


{largest prime to look for} 
{number of butter slots} 


var in: index; 
out: index; 

butter: array[/ndex] of integer; 


{butter slots numbered from 1 to BufSize) 

{next free Slot for a prime to go into} 
{next prime to be tetched and printed} 
{shared butter} 


lunction next (k: index): index,’ 

{Compute the successor to k taking vvraparound into account) 

begin 

ttk< BufSize then next: = k + 1 else next:= 1 
end: {next} 

procedure producer; 

{In thìs improved version, the producer puts primes in the buíter for 
subsequent printing. When the butter is tull, the producer goes to sleep 
by doing a DOWN õn availabie. When the consumer does an UP on available, 
the producer continues at P3. DOWN an UP are level 3 instructions that 
are invoked by the líbrary procedures down and up, respectively}. 

var prime: integer; 
begln 

prime: = 2; 

while prime < MaxPrime do 

bẹgln 

{P1 } ComputeNextPrime (prime) 

{P2} dowr> (avai lable ); 

{P3} butter [/n]: = prìme\ 

{P4} in: = next(in)-, 

{P5> up (ỉilled) 
and 

end; {producer} 


procedure consumer; 

{The consumer takes numbers out of the bưtỉer and prints them. If the butter 
becomes empty, the consumer goes to sleep. When the producer sends a vvakeup 
signal, the consumer continues at C2} 
var emirp: integer; 
begln 
emirp: — 2; 

whlle emirp < MaxPrime do 

begin 

{C1 > down ựilled}; 

{C2> emirp:= butter (outJ; 

{C3} out:= next (out); 

{C4} up (available) 

{C5> wríteln (emirp) 
end 

end: {consumer} 


Hình 6.36 Xứ lý song song dùng semaphore 
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Bây giờ ta sẽ khảo sát lại điều kiện tranh dua. Ở vào một thời 
điểm nào đó, in = 22 và out = 21, producer ồ Pl và consumer ở C5. 
Consumer kết thục công việc đang làm và đi đến Cl ở đó consumer 
thực thi chỉ thị DOWN trên semaphore , semaphore có giá trị 1 trước 
chỉ thị DOWN và 0 sau chỉ thị này. Sau đó consumer lấy sô cuối 
cùng ra khỏi vùng đệm và thực thi UP trên available làm cho 
available bằng 100. Consumer in sô' đó và đi đến Cl. Ngay trước khi 
consumer có thể thực hiện chỉ thị DOWN, producer thây một sô 
nguyên tố kế và nhanh chóng thực thi thành công các phát biểu P2, 
P3 và P4. 

Ở thời điểm này filled bằng 0. Producer thực hiện ƯP và 
consumer thực hiện DOWN trên filled. Nếu consumer thi hành chỉ 
thị trước, consumer sẽ bị treo cho tới khi được producer giải phóng 
( bằng cách thực hiện một ƯP ). Mặt khác nếu producer thi hành 
chỉ thị trước, semaphore sẽ được thiết lập bằng 1 và consumer 
không bị treo. Trong cả 2 trường hợp đều không có tín hiệu đánh 
thức bị mất mát. Dĩ nhiên đây là mục tiêu của chúng ta trong việc 
giới thiệu các semaphore. 

Đặc tính chủ yếu cua các hoạt động của semaphore là chúng 
không khả phân ( indivisible ). Một khi một hoạt động của 
semaphore đã được khởi dộng, không có một quá trình nào khác có 
thể sử dụng semaphore cho tới khi quá trình đầu tiên hoặc hoàn tât 
hoạt động hoặc bị treo. Hơn nữa với các semaphore, không có tín 
hiệu đánh thức nào bị mât mát. Trái lại các phát biểu của hình 6.36 
là khả phân. Giữa sự đánh giá của điều kiện và sự thực thi của 
phát biểu được chọn lựa, quá trình khác có thể gởi một tín hiệu 
đánh thức. 

Vấn đề đổng bộ quá trình có thể được loại bỏ bởi sự khai báo 
các chỉ thị ƯP và DOWN không khả phân. Để cho các chỉ thị cấp 3 
này là không khả phân, hệ điều hành phải ngăn cản hai hay nhiều 

quá trình ra khỏi việc sử dụng cùng semaphore ở cùng thời điểm. 

• 

Việc đồng bộ hóa bằng cách sử dựng semaphore là một kỷ thuật 
hoạt dộng với nhiều quá trình một cách ngẫu nhiên. Vài quá trình 
có thể đang ngủ, đang ccí gắng hoàn tât chỉ thị DOWN trên cùng 
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một semaphore. Khi một số quá trình khác cuối cùng thực thi một 
ƯP trên semaphore đó, một trong các quá trình đang chờ sẽ được 
phép hoàn tất chỉ ■ thị DOWN và tiếp tục chạy. Giá trị của 
semaphore vẫn duy trì là 0 và các quá trình khác tiẽp tục chờ. 

6.4 TÓM TẮT 

Hệ điều hành có thể được xem như một trình phiên dịch với các 
đặc tính có câu trúc nào đó không tìm thây ở câp 2. Các đặc tính 
chủ yếu là bộ nhớ ảo, các chỉ thị I/O ảo và cấc tiện ích cho xử lý 
song song. 

Bộ nhớ ảo là một đặc tính có cấu trúc với mục đích cho phép các 
chương trình sử dụng nhiều không gian địa chỉ hơn so với bộ nhớ 
vật lý của máy hoặc cung câp một cơ chế bảo vệ bộ nhớ linh động 
và thích hợp. Bộ nhớ ảo có thể được hiện thực bằng cách phân 
trang thuần túy, phân đoạn thuần túy hoặc kết hợp cả 2. Các giải 
thuật thay thế trang và phân trang theo yêu cầu đã được giải thích. 
Việc quản lý bộ nhớ trên 80386 và 68030 được mô tả một cách chi 
tiết. 

Trừu tượng xuất / nhập quan trọng nhât hiện diện ở cấp 3 là 
tập tin. Tập tin bao gồm một chuỗi các bản ghi logic có thể được 
đọc hoặc được ghi mà không cần biết về cằch mà các đĩa từ, băng từ 
hoặc bộ nhớ phụ khác và các thiết bị I/O khác làm việc. Các tập tin 
có thể được truy xuất tuần tự, ngẫu nhiên bằng số của bản ghi hoặc 
ngẫu nhiên bằng khóa. Các thư mục có thể được dùng để nhóm các 
tập tin với nhau. Các vấn đề hiện thực khác nhau đã được thảo 
luận. 

Xử lý song song thường hiện diện ở câ'p 3 và được hiện thực 
bằng cách mô phỏng nhiều bộ xử lý ảo nhờ vào việc dùng chung 
một CPU vật lý. Các tác động jqua lại không điều khiển được giữa 
các quá trình có thể dẫn đến các điều kiện tranh đua. Để giải quyết 
vấn đề này, các phương pháp đồng bộ hóa dược giới thiệu, trong đó 
có semaphore. Bằng cách sử dụng semaphore , các vấn đề producer- 
consumer có thể được giải quyết một cách đơn giản và tốt đẹp. 
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CẤP HỘP ngữ 


Trong các chương 4, 5 và 6 chúng ta đã thảo luận 3 cấp máy 
khác nhau có mặt tré^i hầu hết các máy tính hiện nay. Chương này 
liên quan chủ yếu đến một cấp máy khác cũng có mặt gần như trên 
tất cả các máy tính hiện đại, câp ngôn ngữ hợp dịch hay cấp hợp 
ngữ ( assembly language level ). Cấp hợp ngữ khác với cấp vi lập 
trình, cấp máy quy ước và cấp máy hệ điều hành đặc biệt về mặt ý 
nghĩa. Cấp này được hiện thực bởi trình dịch, không phải trình 
phiên dịch. 

Các chương trình biến đổi chương trình của người sử dụng được 
viết bằng một ngôn ngữ này thành một ngôn ngữ khác được gọi là 
trình dịch ( translator ). Ngôn ngữ dùng viết chương trình ban đầu 
được gọi là ngôn ngữ nguồn ( source language ) và ngôn ngừ mà 
chương trình ban đầu được biến đổi thành gọi là ngôn ngữ đích 
(target language ). Cả 2 ngôn ngữ nguồn và ngôn ngừ đích đều xác 
định các cấp. Nếu bộ xử lý có thể thực thi trực tiếp các chương 
trình viết bằng ngôn ngữ nguồn, ta không cần dịch chương trình 
nguồn thành chương trình trong ngôri ngữ đích. 

Việc dịch được sử dụng khi bộ xử lý ( hoặc phần cứng hoặc một 
trình phiên dịch ) chỉ có thể dùng được cho ngôn ngữ đích mà 
không dùng được cho ngôn ngữ nguồn. Nếu việc dịch được thực hiện 
đúng, việc chạy chương trình dã được dịch sẽ cho cùng một kết quả 
như khi thực hiện chương trình nguồn đã cho bằng cách dụng bộ xử 
lý nếu có thể. Kết quả là ta có thể hiện thực một cấp mới không có 
bộ xử lý bằng cách trước tiên dịch các chương trình viết cho cấp 
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này thành các chương trình trong cấp đích ( target level ) và sau đó 
thực thi các chương trình ở cấp đích. 

Điều quan trọng cần lưu ý là sự khác nhau giữa dịch và phiên 
dịch. Trong dịch, chương trình ban đầu viết bằng ngôn ngữ nguồn 
không được thực hiện trực tiếp. Thay vào đó, chương trình này được 
đổi thành một chương trình tương đương gọi là chương trình đối 
tượng ( object program ) hoặc mô-đun đối tượng ( object module ). 
Việc thực thi chương trình đôi tượng chỉ được tiến hành sau khi 
việc dịch đã hoàn tất. Trong dịch, ta có hai bước phân biệt: 

1. Tạo ra một chương trình tương đương trong ngôn ngữ 
đích. 

2. Thực hiện chương trình mới vừa tạo. 

Hai bước này không xảy ra đồng thời. Bước thứ hai không được bắt 
đầu cho đến khi bước thứ nhất đâ hoàn tất. Trong phiên dịch chỉ có 
một bước : thực hiện chương trình nguồn ban đầu, không cần tạo ra 
chương trinh tương đương trước. Phiên dịch có điểm lợi là kích 
thước chương trình nhỏ hơn và linh động hơn còn dịch có thuận lợi 
là việc thực thi sẽ nhanh hơn. 

Trong lúc thực thi chương trình đối tượng, chỉ có 3 cấp hiển 
nhiên : cấp vi chương trình, câp máy quy ước và cấp máy hệ điều 
hành. Kết quả là 3 chương trình, chương trình đôi tượng của ngưdi 
sử dụng, hệ điều hành và vi chương trình, có thể được tìm thấy 
trong bộ nhớ của máy tính vào thời gian chạy. Tất cả dấu vết của 
chương trình nguồn hoàn toàn biến mất. Vậy thì số cấp máy hiện 
diện tại thời điểm thực thi có thể khác với số câ'p máy hiện diện 
trước khi dịch. Tuy nhiên, nên lưu ý rằng mặc dù ta định nghĩa một 
cấp máy bằng các chỉ thị và các cấu trúc ngôn ngừ có thể dùng được 
đôi với người lập trinh ở cấp đó ( không phải bằng phương pháp 
hiện thực ), đôi khi các tác giả khác lại tạo ra sự phân biệt lớn hơn 
giữa các câp được thực hiện bằng các trình phiên dịch thời gian 
thực thi ( execution-time ) và các câ'p được thực hiện bằng dịch. 
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7.1 GIỚI THIỆU HỢP ngữ 

Các trình dịch có thể được chia thành 2 nhóm tùy thuộc vào môi 
tương quan giữa ngôn ngữ nguồn và ngôn ngữ đích. Khi ngôn ngữ 
nguồn thực chất là sự biểu diền ký hiệu cho một ngôn ngữ máy 
dạng số, trình dịch được gọi là trình dịch hợp ngữ hay trình hợp 
dịch ( assembler ) và ngôn ngữ nguồn được gọi là hợp ngữ. Khi 
ngôn ngữ nguồn là một ngôn ngừ cấp cao như c hoặc Pascal và 
ngôn ngữ đích hoặc là một ngôn ngữ máy dạng số hoặc một sự biểu 
diễn ký hiệu, trình dịch được gọi là trình biên dịch ( compiler ). 

7.1.1 Hợp ngữ ỉà gì ? 

Hợp ngữ thuần túy là một ngôn ngữ trong đó mỗi phát biểu tạo 
ra đúng một chỉ thị máy. Nói cách khác, có tương ứng một-một giữa 
các chỉ thị máy và các phát biểu trong chương trình hợp ngữ. Nếu 
mỗi dòng trong chương trình hợp ngữ chứa một phát biểu hợp ngữ 
và mỗi từ máy chứa một chỉ thị máy, chương trình hợp ngữ rc-dòng 
sẽ sinh ra chương trình ngôn ngữ máy n-từ. 

Lý do con người sử dụng hợp ngữ, không lập trình trên ngôn 
ngữ máy ( cơ sô' 8 hoặc 16 ), là chương trình hợp ngữ dễ viết hơn 
nhiều. Việc sử dụng tên ký hiệu và địa chỉ ký hiệu thay cho các tên 
và địa chi dạng số nhị phân hoặc cơ sô' 8 tạo nên một khác biệt rất 
lớn. Hầu hết mọi người đều nhớ chữ viết tắt của cộng, trừ, nhân và 
chia là ADD, SƯB, MƯL và DIV, nhưng ít người nhớ được các chỉ 
thị máy ( đối với PDP-11 ) là 24576, 57344, 28672 và 29184. Người 
lập trình hợp ngữ chỉ cần nhớ tên ký hiệu ADD, SUB, MUL và DIV 
bởi vì trình dịch hợp ngữ dịch chúng thành các chỉ thị máy, còn 
người lập trình ngôn ngữ máy phải nhớ hoặc phải thường xuyên 
tìm kiếm các giá trị sô'. 

Các nhận xét về địa chỉ cũng giông như vậy. Người lập trình 
hợp ngữ có thể gán tên ký hiệu cho các vị trí của bộ nhớ và trình 
dịch hợp ngữ có nhiệm vụ cung cấp đúng các giá trị bằng số. Người 
lập trình ngôn ngữ máy phải luôn luôn làm việc với các giá trị bằng 
số của các địa chỉ. Kết quả là ngày nay không còn chương trình viết 
bằng ngôn ngữ máy, mặc dù người ta đã làm như vậy qua nhiều 
năm trước khi trình dịch hợp ngữ được phát minh. 
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Các hợp ngữ còn có một đặc tính khác phân biệt chúng với các 
ngôn ngữ cấp cao bên cạnh việc ánh xạ một-một giữa các phát biểu 
hợp ngữ và các chỉ thị máy. Người lập trình hợp ngữ truy xuất được 
tất cả dặc tính và các chỉ thị có thể được dùng trên máy đích. 
Người lập trình trên ngôn ngữ cấp cao không thể truy xuất được. 
Thí dụ nếu máy đích có một bít tràn, một chương trình hợp ngữ có 
thể kiểm tra bit này nhưng một chương trình Pascal không thể 
kiểm tra một cách trực tiếp. Nếu có nhiều chuyển mạch ( switch ) 
trên bàn điều khiển ( operator console ), một chương trình hợp ngữ 
có thể đọc trạng thái cửa chúng. Một chương trình như vậy có thể 
thực thi mọi chỉ thị trong tập chỉ thị của máy đích, chương trình 
viết bằng ngôn ngữ cấp cao không thể thực hiện được. Tóm lại, mọi 
điều có thể thực hiện bằng ngôn ngữ máy cũng có thể thực hiện 
được bằng hợp ngữ, nhưng nhiều chỉ thị, thanh ghi và những đặc 
tính tương tự lại không dùng được cho người lập trình ngôn ngữ cấp 
cao. Các ngôn ngữ lập trình hệ thống thường có sự pha trộn giữa 2 
loại ngôn ngữ này, với cú pháp của một ngôn ngừ cấp cao nhưng 
truy xuất tới CPU bằng hợp ngữ . 

Một khác nhau cuối cùng cần được làm rõ là một chương trình 
hợp ngữ chỉ có thể chạy trên một họ máy, trái lại chương trình viết 
bằng ngôn ngữ cấp cao có khả năng chạy trên nhiều máy. Đối với 
nhiều ứng dụng, khả năng chuyển phần mềm từ máy này sang máy 
khác có ý nghĩa rất thiết thực. 

7.1.2 Dạng của một phát biểu hợp ngữ 

Mặc dù cấu trúc của một phát biểu ( statement ) hợp ngữ phản 
ánh gần như trung thực cấu trúc của chĩ thị máy, các hợp ngữ của 
các máy khác nhau và các cấp khác nhau có sự giông nhau đủ để 
cho phép ta thảo luận tổng quát về hợp ngữ. Hình 7.1 trình bày các 
đoạn của các chương trình hợp ngữ cho 80386 và 68030, cả 2 đều 
thực hiện phép toán N = / + J + K. Trong cả 2 thí dụ, các phát biểu 
ở phía trên các dấu chấm thực hiện việc tính toán. Các phát biểu ở 
phía dưới các dấu chấm là các lệnh ( command ) để trình dịch hợp 
ngữ dành bộ nhớ cho các biến /, e/, K và N, không phải là những 
biểu diễn ký hiệu của chỉ thị máy. Các phát biểu là những lệnh cho 
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trình dịch hợp ngữ được gọi là những giả chỉ thị ( pseudo- 
instruction ). 


Label flold 

Operation Operands 
Ãeĩd fiald 

FORMUL: 

MOV 

EAX, 1 


ADD 

EAX, j 


ADD 

EAX, K 


MOV 

m 

N, EAX 

1: 

DO 

2 

ji 

DD 

3 

Kỉ 

DD 

4 

N: 

DD 

0 


Comments tleld 

; LOAD IINTO EAX 
; ADÕ J TO EAX 
; ADD K TO EAX 
; STOHE 1+J+K IN N 


; RESERVE 4 BYTẸS INTIALI2ED TO 2 
; RESERVE 4 BYTES INTIALIZED TO 3 
■ RESERVE 4 BYTES INTÌĂUZED Tỏ 4 
; RESERVE 4 BYTES INTIALIZED TO 0 


(a) 


FORMUL: 

MOVE.L 

1, DO 


ADD.L 

j, DÒ 


ADD.L 

K , DO 


MOVE.L 

■ 

00, N 

1: 

DC.L 

2 

Ji 

DC.L 

3 

K: 

DC.L 

4 

N: 

DC.L 

0 


LOAD IINTO DO 
ADD J TO DO 
ADD K TO DO 
STORẼ l+J+K IN N 


RESERVE 4 BYTES INTIALIZED TO 2 
RESERVE 4 BỸTES INT»ALIZED TO 3 
RESERVE 4 BỸTES ĨNTtALÍZED TỌ 4 
RESERVE 4 BỸTES INTIAUZED TO 0 


<b> 


Hình 7.1 Tính công thức N = ỉ + J + K (a) 80386 (b) 68030 


Label field : trường nhãn 
Operation íleld : trường thao tác 
Operands íĩeld ; trường toán hạng 
Comments íìelđ : trường chú thích 


Các phát biểu hợp ngữ có 4 phần : trường nhãn ( label ), trường 
thao tác ( operation ), trường toán hạng ( operand ) và trường chú 
thích ( comment). Các nhãn được dùng để cung cấp các tên ký hiệu 
cho các dịa chỉ bộ nhớ, cần có trên các phát biểu thực thi để có thể 
nhảy tới các phát biểu đó. Nhãn cũng cần có trên các giả chỉ thị 
cấp phát bộ nhớ ( thí dụ DD và DC ) cho phép dữ liệu đã cất ở đó 
có thể truy xuất được bằng tên ký hiệu. Nếu một phát biểu được 
gán nhãn, (thông thường ) nhãn bắt đầu ở cột 1. 
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Hình 7.1 (a) trình bày 5 nhãn : FORMUL , /, J, K và N. Hình 
7.1 (b) cũng trình bày 5 nhãn giống như vậy. Lưu ý là hợp ngữ của 
Motorola yêu cầu dâu hai châm sau mỗi nhãn, trong khi hợp ngữ 
của Intel thì không. Không có gì quan trọng về sự khác biệt này. 
Đây chỉ là sự khác biệt về sở thích của các nhà thiết kế. Người 
thiết kế một trình dịch hợp ngữ cho cả 2 máy hoàn toàn tự do chọn 
lựa bât kỳ quy ước nào trong phạm vi này nếu anh ta muốn. Không 
có một gợi ý nào về việc chọn cấu trúc này hoặc câu trúc kia. 

Đặc tính đáng tiếc của một số trình dịch hợp ngữ là các nhãn bị 
hạn chê chỉ có 6 hoặc 8 ký tự. Trái lại, đa sô" các ngôn ngữ cấp cao 
cho phép sử dụng các tên dài tùy ý. Việc chọn tên nhãn đúng và dài 
giup cho chương trình dễ đọc và dễ hiểu ( xem hình 2.2 làm thí dụ 
về điểm này ). 

Trường thao tác hoặc chứa ký hiệu viết tắt của opcode nếu phát 
biểu là một biểu diễn ký hiệu cho chỉ thị máy hoặc chứa một giả chỉ 
thị nếu phát biểu là lệnh cho trình dịch hợp ngữ. Việc chọn lựa một 
tên thích hợp chỉ là vấn đề sở thích và các nhà thiết kế hợp ngữ 
khác nhau thường có những chọn lựa khác nhau. Các nhà thiết kê 
của Intel thích MOV còn các nhà thiết kê của Motorola thích 
MOVE hơn cho chí thị di chuyển . 

80386 và 68030 đều cho phép các toán hạng là byte, từ và từ 
dài. Làm thê nào trình dịch hợp ngữ biết chiều dài nào được sử 
dụng ? Một lần nữa, 2 nhóm thiết kê khác nhau sẽ có những giải 
pháp khác nhau. Intel dùng tên thanh ghi khác nhau dể phân biệt, 
EAX được dùng để chuyển các phần tử 32-bit, AX dùng để chuyển 
các phần tử 16-bit và AL hoặc AH dùng để chuyển các phần tử 8- 
bit. Trái lại Motorola quyết định thêm hậu tố ,L cho từ dài, .w cho 
từ hoặc .B cho byte đối với từng toán hạng. Cả 2 cách đều có giá trị 
nhưng cũng nói lên bản chất tùy tiện trong việc thiết kế ngôn ngữ. 

Hai trình dịch hợp ngữ cũng có tên giả chỉ thị khác nhau dùng 
để dành không gian cho dừ liệu. Intel chọn DD ( deĩine data ); 
Motorola thích DC ( deíine constant ). Đây cũng chỉ đơn thuần là 
vấn đề sở thích. 
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Trường toán hạng của một phát biểu hợp ngữ dùng để xác định 
các địa chỉ và các thanh ghi được chỉ thị máy dùng làm các toán 
hạng. Trường toán hạng của chĩ thị cộng số nguyên cho biết phải 
cộng scí hạng nào với số hạng nào. Trường toán hạng cửa chỉ thị 
nhảy cho biết nhảy đến đâu. Trường toán hạng của giả chỉ thị tùy 
thuộc vào giả chỉ thị, thí dụ dành bao nhiêu không gian bộ nhớ. 

Trường chú thích cung cấp một nơi để người lập trình ghi lời 
giải thích về cách làm việc của chương trình nhằm giúp người lập 
trình khác sau này có thể sử dụng hoặc sửa đổi chương trình. 
Chương trình hợp ngữ không có tư liệu cung cấp như vậy nên tâ't cả 
người lập trình gần như không thể hiểu được đầy đủ, kể cả 
người viết ( tác giả ) chương trình đó. Trường chú thích chỉ dành 
cho người sử dụng; không ảnh hưởng đến quá trình hợp dịch 
( assembly process ) hoặc đến chương trình được tạo ra. 

7.1.3 So sánh hợp ngừ với ngôn ngữ câ'p cao 

Huyền thoại phổ biến là các chương trình thường được sử dụng, 
để có hiệu quả, nên được viết toàn bộ bằng hợp ngữ. Xưa kia ý 
tưởng này là đúng, nhưng bây giờ không còn thích hợp hoàn toàn 
nữa. Để có nhiều thông tin hãy so sánh hệ thống MƯLTICS với hệ 
thống chia xẻ thời gian của IBM, 360/67, TSS/67. Cả 2 hệ điều 
hành được thiết kế cùng thời và có kích thước lớn tương đương. Hầu 
hết chương trình trong MƯLTICS c 95% ) được viêt bằng ngôn ngữ 
cấp cao PL/1 trong khi TSS/67 được viết hoàn toàn bằng hợp ngữ. 

Một hệ điều hành lớn như MƯLTICS là một kiểm tra nghiêm 
ngặt đối với ngôn ngữ cấp cao. Bởi vì hệ điều hành phải điều khiển 
tất cả thiết bị I/O, xử lý các tình huống định thì tới hạn, điều khiển 
các cơ sở dữ liệu lớn và thực hiện nhiều nhiệm vụ khác, nên hiệu 
suất tốt là điều cốt lõi. Nếu ngôn ngữ cấp cao thông qua được sự 
kiểm tra nghiêm ngặt này, sẽ có vài ứng dụng lớn thực sự nhờ đó 
người ta có thể chứng minh các thuận lợi đạt được so với cách dùng 
hợp ngữ ( tuy nhiên việc lập trình bộ vi xử lý trong một máy giặt 
lại là một chuyện khác, do số lượng lớn được bán ra ). 

Kết quả của 2 dự án này được tổng kết một cách thú vị với thời 
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cần 50 người viết với giá thành ước tính khoảng 10 triệu đô la 
trong khi TSS/67 cần 300 người với giá thành ước tính 
khoảng 50 triệu đô la ( Graham, 1970 ). Hơn nữa, MULTICS cuối 
cùng đã làm việc. Kết luận rằng việc dùng ngôn ngữ PL/1 đã tiết 
kiệm cho đề án MULTICS hàng chục triệu đô la là điều không thể 
bỏ qua được. 

Các nghiên cứu cho thây sô các dòng mã được sửa sai mà người 
lập trình có thể tạo ra mỗi tháng trên một đề án đã qua 1 chu kỳ 
vài năm xấp xỉ khoảng 100 tới 200 dòng, độc lập với ngôn ngữ lập 
trình được sử dụng ( Corbató, 1969 ). Chỉ trẽn những chương trình 
nhỏ, hiệu suât cao hơn có thể được kỳ vọng. Vì một phát biểu của 
PL/1 tương đương với 5 hoặc 10 phát biểu hợp ngữ, nên hiệu suất 
của người lập trình dùng PL/1 sẽ gấp 5 tới 10 lần so với người lập 
trình dùng hợp ngữ. Tình trạng cũng giông như vậy đôi với những 
ngôn ngữ cấp cao khác. 

Một lý lẽ vững chắc khác chông lại việc lập trình bằng hợp ngữ 
là ta không thể hiểu được chương trình hợp ngữ của một người 
khác. Một danh sách đầy đủ của MƯLTICS bằng ngôn ngữ PL/1 dài 
khoảng 3.000 trang, thật khó lĩnh hội được chỉ trong một buổi. Tuy 
nhiên thật thú vị khi so sánh lượng bình thường đó với việc đọc 
30.000 trang mã hợp dịch ( assembly code ). Mặc dù không có ai thử 
đọc toàn bộ chương trình liệt kê của MƯLTICS, nhưng người ta vần 
thử tìm hiểu những thủ tục riêng rẽ trung bình dài khoảng 4 trang 
của PL/1. Tôc độ thay thê nhân viên trên những dự án lớn trung 
bình khoảng 15% mỗi năm; do đó, sau 5 năm chỉ còn lại vài người 
lập trình ban đầu. Nêu những người lập trình mới không thể hiểu 
những chương trình của người tiền nhiệm, đề án sẽ gặp rắc rối lớn. 

7.1.4 Điều chỉnh chương trình 

Các nghiên cứu cho thấy trong đa sô- chương trình, chỉ có một tỉ 
lệ nhỏ của toàn bộ mã chịu trách nhiệm cho một tỉ lệ lớn thời gian 
thực thi ( Darden và Heller, 1970 ). Thông thường có 1% chửơng 
trình chịu trách nhiệm cho 50% thời gian thực thi và 10% chương 
trình chịu trách nhiệm cho 90% thời gian thực thi. Tình trạng 
chung trong một trình biên dịch là việc tìm kiếm bảng ký hiệu có 
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thể ngốn hết nhiều thời gian hơn phần còn lại của trình biên dịch 
được kết hợp. 

Thí dụ, giả sử cần 10 năm-người ( man-year ) để viết một trình 
biên dịch lớn nào đó bằng ngôn ngữ câ'p cao và trình biên dịch sinh 
ra cần 100 sec để dịch một chương trình kiểm tra nào đó. Viết toàn 
bộ trình biên dịch bằng hợp ngữ sẽ cần từ 50 tới 100 năm-người, do 
bởi hiệu quả của người lập trình hợp ngữ thâ'p hơn; tuy nhiên, 
chương trình cuối cùng sẽ thực hiện kiểm tra trong khoảng 33 sec, 
bởi vì người lập trình thông minh có thể làm tốt hơn một trình 
biên dịch thông minh với hệ số là 3. Tình trạng này được trình bày 
trong hình 7.2. 


- 

Số năm 
cần để 
tạo ra 

Thời gian 
thực thi 
( sec ) 

Hợp ngữ 

50 

33 

Ngôn ngữ hướng vấn dề 

10 

100 

Phương pháp trộn trước khi hiệu chỉnh 



Tới hạn 10% 

01 

90 

Khác 90% 

09 

10 

Tổng 

10 

100 

Phương pháp trộn sau khi hiệu chỉnh 



Tới hạn 10% 

06 

30 

Khác 90% 

09 

10 

Tổng 

15 

40 


Hình 7.2 So sánh lập trình bằng hợp ngữ và ngôn ngữ câp cao, có và 

không có điều chỉnh 

Dựa vào quan sát trên, chỉ có một phần nhỏ mã chịu trách 
nhiệm cho phần lớn thời gian thực thi nên có thể có một phương 
pháp khác. Trước tiên chương trình được viêt bằng ngôn ngữ cấp 
cao, sau đó thực hiện một loạt các phép đo để quyêt định phần nào 
của chương trình tiêu tốn phần lớn thời gian thực thi. Các phép đo 
như vậy thường bao gồm việc sử dụng đồng hồ hệ thông ( System 
clock ) để tính toán lượng thời gian tiêu phí trong mỗi thủ tục, theo 
dõi số lần thực hiện mỗi một vòng lặp và các bước tương tự. 
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Thí dụ ta giả sử 10% trong toàn bộ chương trình tiêu tồn 90% 
thời gian thực thi. Điều này có nghĩa là với một công việc 100-sec 
có 90 sec được tiêu phí vào 10% tới hạn và 10 sec được tiêu phí cho 
90% phần chương trình còn lại. Bây giờ 10% tới hạn được cải tiến 
bằng cách viết lại bằng hợp ngữ. Quá trình này được gọi là điều 
chỉnh và được minh họa trong hình 7.2. ơ đây cân thêm 5 năm- 
người nữa để viết lại những thủ tục tới hạn này nhưng thời gian 
thực thi chúng giảm từ 90 sec xuôứig còn 30 sec. 

Đây là thông tin có ích để so sánh phương pháp trộn lần ngôn 
ngữ cấp cao và ngôn ngừ hợp dịch với phiên bản hợp ngữ thuần túy 
( xem hình 7.2 ). Phương pháp viết bằng hợp ngữ thuần túy cho 
chương trình thực thi nhanh hơn 20% nhưng giá thành tăng hơn 
gấp 3 lần. Hơn nữa, thuận lợi của phương pháp trộn lẫn thực sự còn 
nhiều hơn bởi vì việc ghi lại một thủ tục ngôn ngữ cấp cao đã sửa 
sai bằng mã hợp dịch thực tế dễ hơn viết một thủ tục mã hợp dịch 
giông như vậy từ bản nháp. Nói cách khác, ước tính 5 năm-người 
để viết lại các thủ tục tới hạn là quá thận trọng. Nếu việc ghi này 
chỉ mất 1 năm, tỉ lệ giá thành giữa phương pháp trộn lẫn và 
phương pháp dùng hợp ngữ thuần túy sẽ nhiều hơn tỉ lệ 4-1 
nghiêng về phương pháp trộn lẫn. 

Nhừng người lập trình dùng ngôn ngữ câ"p cao sẽ không bị 
vướng vào việc di chuyển các bit và đôi khi đạt được khả năng thấu 
hiểu vân đề, cho phép họ thực sự cải thiện hiệu suất. Tình huống 
này ít xảy ra hơn cho những người lập trình hợp ngừ, thường họ cô" 
sắp xêp các chí thị để tiêt kiệm vài microsec. Graham ( 1970 ) công 
bô một thủ tục PL/1 trong MULTICS được viết lại trong 3 tháng với 
phiên bản mới nhỏ hơn 26 lần và nhanh hơn phiên bản ban đầu 50 
lần, cũng như một phiên bản khác nhỏ hơn 20 lần và nhanh hơn 40 
lần với 2 tháng làm việc. 

Corbató ( 1969 ) mô tả thủ tục quản lý trống ( drum ) cửa PL/1 
dược giảm từ 50.000 còn 10.000 từ mã biên dịch trong vòng không 
đầy một tháng và một trình điều khiển I/O được rút ngắn từ 65.000 
xuống còn 30.000 từ mả biên dịch, với tốc độ cải tien có hệ số là 8 
trong 4 tháng. Quan điểm ở dây là do những người lập trình ngôn 
ngữ cấp cao có tầm nhìn bao quát hơn về những gì họ đang làm, họ 
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muốn đạt được khả năng thấu hiểu dẫn đến những giải thuật hoàn 
toàn khác và tốt hơn nhiều. 

Sau phần giới thiệu này, cố thể chúng ta sẽ ngạc nhiên tự hỏi : 
“ Tại sao phải nghiên cứu lập trình hợp ngữ rắc rối, trong khi quá 
dở như vậy ? ít nhất cũng có 3 nguyên nhân. Trước tiên, do bởi 
sự thành công hay thất bại của một dự án lớn có thể tùy thuộc vào 
việc nén với hệ số là 5 hoặc 10 lần sự cải tiến về hiệu suất ngoài 
một thủ tục tới hạn nào đó mà điều quan trọng là viết mã hợp ngữ 
khi thực sự cần thiết. Thứ hai, đôi khi mã hợp dịch chỉ là một 
phương án chọn lựa do thiếu bộ nhớ ( máy tính bỏ túi có 1 CPU 
nhưng ít khi nào có tới 1 megabyte bộ nhớ và càng ít khi nào có đĩa 
cứng ). Thứ ba, trình biên dịch hoặc phải tạo ra sản phẩm được một 
trình dịch hợp ngữ sử dụng hoặc phải tự thực hiện quá trình hợp 
dịch ( assembly process ). Như vậy sự hiểu biết về hợp ngữ là yếu tô' 
thiết yếu để hiểu cách làm việc của trình biên dịch. 

7.2 QUÁ TRÌNH H0P dịch 

Trong các phần sau đây ta sẽ mô tả rõ cách làm việc của một 
trình dịch hợp ngữ. Mặc dù mỗi máy có một ngôn ngữ hợp dịch 
khác nhau, nhưng quá trình hợp dịch ( assembly process ) lại khá 
giông nhau trên những máy khác nhau nên ta có thể mô tả theo 
những thuật ngữ chung. 

7.2.1 Trinh dịch hợp ngữ 2 bước 

Do một chương trình hợp ngữ bao gồm một chuồi các phát biểu 
một dòng nên dường như tất nhiên trình dịch hợp ngữ đọc một 
phát biểu, dịch thành ngôn ngữ máy và sau đó xuất ngôn ngữ máy 
đã tạo ra lên một tập tin cùng với phần danh sách tương ứng nếu 
có, lên một tập tin khác. Quá trình này sè được lập lại cho tới khi 
toàn bộ chương trình được dịch. Đáng tiếc là phương pháp này 
không làm việc được. 

Xét trường hợp mà phát biểu đầu tiên là chỉ thị nhảy tới L. 
Trình dịch hợp ngừ không thể hợp dịch phát biểu này cho tới khi 
biết được địa chỉ của phát biểu L. Phát biểu L có thể ở gần cuối 
chương trình, làm cho trình dịch hợp ngữ không thể tìm địa chỉ mà 
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không đọc trước hầu hết toàn bộ chương trình. Khó khăn này được 
gọi là vân đề tham chiếu trước ( forward reíerence problem ), bởi vì 
ký hiệu L được sử dụng trước khi được định nghĩa; nghĩa là tham 
chiếu một ký hiệu mà ký hiệu này sè được định nghĩa sau. 

Tham chiếu trước được điều khiển theo 2 phương pháp. Trong 
phương pháp thứ nhất, trình dịch hợp ngữ thực tế đọc chương trình 
nguồn 2 lần. Mỗi lần đọc chương trình nguồn được gọi là một bước; 
một trình dịch bất kỳ đọc chương trình nhập 2 lần được gọi là trình 
dịch 2 bước. Trong bước 1 của trình dịch hợp ngữ 2 bước, các ký 
hiệu kể cả các nhãn của phát biểu được tập hợp và cất trong một 
bảng. Lúc bắt đầu bước 2, các giá trị của tất cả ký hiệu đã được 
biết; như vậy không còn tham chiếu trước nữa và từng phát biểu có 
thể được đọc, hợp dịch và xuất. Phương pháp này tuy đòi hỏi thêm 
một bước nữa để đọc chương trình nhập nhưng lại không phức tạp. 

Phương pháp thứ 2 là thực hiện việc hợp dịch, dù thế nào cũng 
chỉ với 1 bước. Mỗi khi gặp một phát biểu không thể hợp dịch được 
do bởi phát biểu chứa một tham chiếu trước, sẽ không có kết quả 
xuất; thay vào đó một điểm nhập ( entry ) được tạo ra trong bảng 
để cho biêt phát biểu có tham chiếu trước chưa được hợp dịch, ở 
cuối quá trinh hợp dịch, tất cả ký hiệu sẽ được xác định nên tất cả 
phát biểu ở trong bảng ( chưa được hợp dịch ) bây giờ có thể được 
hợp dịch. 

Phương pháp sau tạo ra kết quả xuất theo một trật tự khác với 
phương pháp 2 bước. Nếu theo sau quá trình hợp dịch là quá trình 
nạp, chương trình nạp ( ìoader ) có thể đặt các phần của kết quả 
xuất quay lại theo trật tự đúng. Trình dịch hợp ngữ 1 bước có vấn 
đề là nếu có nhiều phát biểu chứa tham chiếu trước, bảng chứa các 
phát biểu chưa hợp dịch có thể trở nên quá lớn đối với bộ nhớ. 
Trình dịch hợp ngừ 1 bước có độ phức tạp lớn hơn và khó in ra một 
danh sách bao gồm cả các mã đối tượng đá sinh ra. Với những lý do 
này, đa sô' các trình dịch hợp ngữ đều có 2 bước. 

7.2.2 Bước 1 

Chức năng chính của bước 1 là xây dựng một bảng gọi là bảng 
ký hiệu ( Symbol table ) chứa giá trị của tất cả các ký hiệu. Một ký 
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hiệu hoặc là một nhãn hoặc là một giá trị dược gán một tên ký hiệu 
bằng một giả chỉ thị, cụ thể như là 

BUFSIZE EQƯ 100 


Trong việc gán một giá trị cho một ký hiệu trong trường nhãn 
của phát biểu, trình dịch hợp ngừ phải biết địạ chỉ mà phát biểu sẽ 
có trong thời gian thực thi chương trình. Để theo dõi địa chỉ thời 
gian thực thi ( execution-time address ) của phát biểu đang được 
dịch, trình dịch hợp ngữ duy trì một biến trong thời gian hợp dịch, 
gọi là bộ đếm vị trí chỉ thị ILC ( instruction location counter ). Biến 
ILC được thiết lập bằng 0 lúc bắt đầu bước 1 và được tăng bởi chiều 
dài của chỉ thị đôi với từng chỉ thị được xử lý như trình bày trong 
hình 7.3. Thí dụ này dành cho 80386. Từ đây trở đi ta sẽ không cho 
thí dụ của Motorola do sự khác nhau giữa 2 ngôn ngữ hợp dịch này 
không quan trọng lắm và chỉ cần một thí dụ là đủ. 


Label 

Operatlon 

Opttranđs 

Comments 

Instructlon 

ILC betore 

fleid 

fleld 

1 

fleid 

Held 

length 

statement 

SUZANNE: 

MOV 

EAX, 1 

EAX = 1 

s 

100 


MOV 

EBX, J 

EBX = J 

6 

105 

MARIA: 

MOV 

ECX, K 

ECX = K 

6 

111 


ĨMUL 

EAX, EAX 

EAX = 1*1 

2 

117 


ĨMUL 

EBX, EBX 

EBX = J*J 

3 

119 

• 

IMUL 

ECX, ECX 

ECX = K*K 

3 

122 

MARILYN: 

ADD 

EAC, EBX 

EAX = 1*1+J*J 

2 

125 


ADD 

EAX, ECX 

EAX = l*l+j*J+K*K 

2 

127 

CAROL: 

MOV 

N, EAX 

N = l*l+J*J+K*K 

5 

129 


JMP 

DÒNẼ 

JUMP TO DONE 

5 

134 


Hình 7.3 Bộ đếm vị trí của phát biểu ( ILC ) theo dõi địa chỉ nơi các phát 
biểu sẽ được nạp vào bộ nhớ. Trong thí dụ này các phát biểu trước nhãn 

SUZANNE chiếm 100 byte 

Label íìeld : trường nhãn 
Operation íleld : trường thao tác 
operands ílelđ : trường toán hạng 
Comments íĩelđ : trường chú thích 
Instruction length : chiều dài của chỉ thị 
ILC before statement : ILC trước phát biểu 

Một sô' trình dịch hợp ngữ cho phép người lập trình viết các chỉ 
thị bằng cách định địa chỉ tức thời cho dù không có chỉ thị tương 
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ứng trong ngôn ngữ đích. Những chỉ thị “ giả tức thời ” ( pseudo - 
immediate ) như vậy được điều khiển như sau. Trình dịch hợp ngữ 
cấp phát bộ nhớ cho các toán hạng tức thời vào cuối chương trình 
và tạo ra một chỉ thị tham chiếu chúng. Chẳng hạn, IBM 370 
không có chỉ thị tức thời nhưng người lập trình có thể viết 

L 14 , = F ’ 5 ’ 

để nạp thanh ghi 14 với một từ Full hằng sô' 5 ( a Full word 
constant 5 ). Bằng cách này, người lập trình tránh được việc phải 
viết cụ thế một giả chỉ thị DC nhằm cấp phát một từ có giá trị khởi 
động là 5. Các hằng sô' mà trình dịch hợp ngừ tự động dự trữ bộ 
nhớ được gọi là các literal. Ngoài việc tiết kiệm việc viết cho người 
lập trình, các literal còn cải thiện tính dễ dọc của chương trình 
bằng cách tạo ra giá trị hằng sô biểu kiến ( apparent ) trong phát 
biêu nguồn. Bước 1 của trình dịch hợp ngữ phải xây dựng một bảng 
cho tất cả các literal được sử dụng trong chương trình. Cả 2 họ CPU 
trong các thí dụ của chúng ta đều có các chỉ thị tức thời nên trình 
dịch hợp ngữ của chúng không cung câ'p các literal . Các chỉ thị tức 
thời pgày nay rất phổ biến nhưng trước đây thì không. Việc sử 
dụng rộng rãi các lỉteraỉ làm cho chương trình rõ ràng hơn đôi với 
người thiết kế máy mà định địa chỉ tức thời là một ý tưởng hay. 

Bước 1 của đa sô' trình dịch hợp ngữ sử dụng ít nhất 2 bảng : 
báng ký hiệu và bảng opcode. Nếu cần cũng có bảng ỉỉteral. Bảng 
ký hiệu có một điểm nhập cho mỗi một ký hiệu, như trình bày 
trong hình 7.4, Các ký hiệu được định nghĩa hoặc bằng cách dùng 
chúng như các nhãn hoặc bởi một định nghĩa cụ thể ( thí dụ EQU 
trên 370 ). Mỗi điểm nhập của bảng ký hiệu chứa chính ký hiệu đó 
( hoặc một con trỏ trỏ tới ký hiệu ) gồm cả giá trị băng sô' và đôi 
khi những thông tin khác. Thông tin thêm vào này có thể bao 
gồm : 

1. Chiều dài của vùng dữ liệu kết hợp với ký hiệu đó. 

2. Các bit tái định vị ( Có phải ký hiệu thay đổi giá trị hay 
không nêu chương trình được nạp ở một địa chỉ khác với 
địa chỉ mà trình dịch hợp ngừ đã giả định ? ). 
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3. Ký hiệu đó có được truy xuất bên ngoài thủ tục hay 
không. 


Symbol 

Value 

Olhar inlormatton 

SUZANNE 

100 


MARIA 

111 


MARILYN 

125 


CAROL 

129 




= ; 


Hình 7.4 Bảng ký hiệu cho chương trình ở hình 7.3 

Symbol : ký hiệu 
Value : giá trị 

Other inĩormation : thông tin khác 

Bảng opcode chứa ít nhất một điểm nhập cho mỗi một opcode 
của ký hiệu ( gợi nhớ ) trong hợp ngữ. Hình 7.5 trình bày một phần 
của bảng opcode. Mỗi một điểm nhập chứa opcode của ký hiệu, 2 
toán hạng, giá trị bằng số của toán hạng, chiều dài của chỉ thị yà 
một sô' của lớp ( a class number ) tách các opcode thành các nhóm 
tùy thuộc vào sô' và loại của các toán hạng. 


Flrst Second Hexadeclmal Instruction Instructlon 


Opcode operand operand opcode _ length class 


AAA 

— 

— 

37 

1 

6 

ADD 

EAX 

IMMED32 

05 

5 

4 

ADD 

REG 

REG 

01 

2 

19 

AND 

EAX 

IMMED32 

25 

5 

4 

AND 

REG 

REG 

21 

2 

19 








Hình 7.5 Một vài trích đoạn từ bảng opcode cho trình dịch hợp ngữ của 

80386 
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Hexadecimal opcode : opcode dạng số hex ( cơ sô 16 ) 

Instruction class : lớp chỉ thị 

Thí dụ xét opcode ADD. Nếu chỉ thị ADD chứa EAX là toán hạng 
thứ nhất và một hằng số 32-bit ( IMMED32 ) là toán hạng thứ 2, 
opcode là 05H và chỉ thị dài 5 byte ( các hằng số có thể được biểu 
diễn bằng 8 hoặc 16 bit dùng các opcode khác nhau, không trình 
bày ở đây ). Nếu chỉ thị ADD dùng 2 thanh ghi làm các toán hạng, 
chỉ thị dài 2 byte với opcode là 01H. Lớp chỉ thị ( tùy ý ) 19 sẽ được 
cung cấp cho tất cả các kết hợp opcode-toán hạng theo những quy 
luật giống nhau và được xử lý theo cùng cách như chỉ thị ADD có 2 
toán hạng thanh ghi. Thực tế lớp chỉ thị chỉ rõ một thủ tục trong 
trình dịch hợp ngữ, thủ tục được gọi dể xử lý tất cả chỉ thị của loại 
đã cho. 

Nếu cần đến các literal , một bảng literal được duy trì trong thời 
gian hợp dịch với điểm nhập mới được tạo ra cho mỗi lần gặp một 
ỉiteral. Tiếp theo sau bước 1 bảng này được sắp xếp để loại bỏ 
những trùng lắp. 

Hình 7.6 trình bày một thủ tục phục vụ như một cơ sở cho bước 
1 của trình dịch hợp ngữ. Kiểu lập trình này rất đáng lưu ý. Tên 
thủ tục được chọn sao cho phù hợp vđi công việc mà thủ tục thực 
hiện. Quan trọng nhâ't là hình 7.6 biểu diễn một phác thảo của bước 
1, hình thành một điểm bắt đầu tốt mặc dù không dầy đủ. Đó là 
một thủ tục ngắn, dễ hiểu và cho biết rõ công việc của bước kế tiếp 
dể viết các thủ tục được sử dụng trong đó. 

Một số trong các thủ tục này rất ngắn, như CheckForLabel , thủ 
tục trả về nhãn như là một chuỗi ký tự nếu có và một chuỗi trông 
nếu không có. Các thủ tục khác, như typeO và typel , có thể dài hơn 
và có thể gọi những thủ tục khác. Nhìn chung, số của các lứp sẽ 
không phải là 2 mà tùy thuộc vào ngôn ngữ được hợp dịch. 

Các chương trình có cấu trúc theo cách này có những thuận lợi 
khác ngoài việc dề lập trình. Nếu trình dịch hợp ngữ được viết bởi 
một nhóm người, những thủ tục khác nhau có thể được chia thành 
từng phần cho những người lập trình. Tất cả những chi tiết ( khó 
chịu ) về việc nhập được ẩn dấu trong ReadNextStatement. Thí dụ, 
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nếu chúng thay đổi do sự thay đổi hệ điều hành, chỉ có một thủ tục 
phụ bị ảnh hưởng và không cần một thay đổi nào cho chính thủ tục 
Passồne. 

Trong một số trình hợp ngữ, sau khi một phát biểu được đọc 
vào, phát biểu đó được cất vào một bảng. Nếu bảng đầy, bảng phải 
được ghi lên đĩa, có thể nhiều lần. Mặt khác, nếu chương trình đang 
được hợp dịch đủ ngắn dặt vừa trong bảng, bước 2 có thể nhận ngõ 
vào trực tiếp từ bảng, như vậy hạn chế được việc xuất / nhập đĩa. 

Khi dọc giả chỉ thị END, bước 1 kết thúc. Các bảng ký hiệu và 
bảng literal được sắp xếp tại điểm này nếu cầu. Bảng literaỉ đã sắp 
xếp có thể được kiểm tra xem có những điểm nhập trùng lắp không 
để loại bỏ bớt. 

7.2.3 Bước 2 

Bước 2 có nhiệm vụ tạo ra chương trình đối tượng ( object 
program ) và có thể in danh sách hợp dịch. Ngoài ra, bước 2 còn 
phải xuất thông tin cần thiết cho trình liên kết ( linker ) để kết nối 
các thủ tục dã được hợp dịch ở những thời điểm khác nhau. Hình 
7.7 trình bày một thủ tục cho bước 2. 

Thủ tục cho mỗi lớp cho biết có bao nhiêu toán hạng mà lớp đó 
có thể có và gọi thủ tục EvaluateExpressỉon ( không trình bày ở 
đây ) một sô lần thích hợp. Thủ tục EvaluateExpression phải đổi 
biểu thức ký hiệu thành sô" nhị phân. Trước tiên thủ tục này tìm giá 
trị của các ký hiệu và địa chỉ của literal từ bảng. Một khi các giá trị 
bằng sô" được biết, biểu thức được đánh giá. Có nhiều kỹ thuật đánh 
giá biểu thức sô học đã được biết. Một phương pháp ( đã mô tả 
trong chương 5 ), đổi biểu thức sang dạng Polish ngược và đánh giá 
biểu thức bằng cách dùng stack. 

Một khi biết được giá trị của opcode bằng số và giá trị của các 
toán hạng, chỉ thị hoàn toàn có thể được hợp dịch. Sau đó chỉ thị đã 
hợp dịch được đưa vào một bộ đệm xuất và được ghi lên đĩa khi bộ 
đệm đầy. 

Phát biểu nguồn ban đầu và mả đô'i tượng ( object code ) được 
tạo ra từ phát biểu nguồn ( ở dạng cơ sô' 8 hoặc cơ số 16 ) hoặc được 
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in hoặc được đưa vào bộ đệm để in sau. Sau khi ILC được điều 
chỉnh, phát biểu kế tiếp được tìm nạp. 


procedure PassOne; 

{This procedure is an outiine of pass one of a simple assembler} 
const SI26= 8; EndStatement= 99; 


var LocationCounter, class, length, value: integer, 
Morelnput: booleán; 

literal, Symbol, opcode; array i [í... sãej of char; 
line: array /1... 80/ of char; 

begln 

LocationCounter: =0; 

Motrlnput: = true; 
lnitialize Tables; 


{inìt instruction location counter} 
{set to talse at END statement} 
{call a procedure to set up tables} 


while Moreinput dữ 

begln 

ReadNextStatement (line); 
SaveLineEorPass (lìne); 


{loop executed once per line} 
{go get some input) 

{save the line) 


\tLinelsNotComment (line) then 
begln 

CheckForSymbol (lìne, Symbol); 
ếf Symbol [7] < > ' ■ then 

EnterNevvSymbol (Symbol, Location Counter); 
LookForLiteral (line, literal); 

Itliteral (7) <>' ‘than 
Enter Literal ( literal) 


{is it a comment?) 

{is there a Symbol?} 

{if column 1 blank, no Symbol) 

{iiteral present?} 

{blank means nó literal presenỉ} 


{Now determine the opcode class, -1 used to sígnal illegal opcode) 

ExtractỌpcodẹ (Ịinẹ, opcodẹ) 

Searchơpcode table (òpcodé, line, class, value); 
lf class < 0 then TryPseudolnstr (opcode, ciass, value); 

lenght; = 0; {compute instructìon iength) 

ữ đass < 0 then illegaỉOpoode; 

ỆậậỆ cỉsss of 

0: length: = type 0 (line) {compute instruction length} 

1: length: = ỉype 1 (line) {ditto} 

(Other cases here) 


and; 

LocatìonCounter: = Location Counter + length; 
if class = EndStatement then 
begin 

Morelnpưt: = talse; 

RewindPassTwolnput; 

SortUteraíTable; 

RemoveReơundentLiterals 

end 

end 

end 

end; (Pass One) 


Hình 7.6 Bước 1 của một trình dịch hợp ngữ đơn giản 
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procedure PassTvvo; 

{This procedure is an outline of pass two of a simple assembler} 
con«t size- 8; EndStatement= 99; 

var coơe. class. velue, LocationCounter, length: ịnteg&r, 

Morelnput: boolean; 

ọpcơởe: array [1 sịzel of char; 
line: array [1... BOỊ ol char 
operands: array II...3] oi integer; 

begtn 

Morelnput: = true; {set to talse at end statement) 

LocatiõnCounter: = 0; 

whlle Morelnput do 

begln 

GạtNoxĩStatBmQnt (line) {get input saved by pass one> 

lfL/ne/sWofCom/nenf (líne) then 
begin 

ExtractOpcode (Ịine, opcede); 

SearchOpcodeTable (opcode, line, ctass, value); 

Ịf < 0 then TryPseudolnstr (opcode, cíass, value; 

length: =0; {compute instruction length} 

lf class < 0 then BadOpcode; 

caae class of 

0: tength: = eva/o (line, operands ); 

1: length: = eva/1 (Ịine, Òperands) ; 

{Other cases here} 

and; 

AssemblePieces (Cồde, class, value, oprands); 

OutputCode (code); 

1 ocationCounter: = Location Counter + length; 
lf clasẹ = EndStatement then 
begln 

Morelnput: - /a/se 
Pinishủp 

end 

and 

and 

end; {Pass Two} 


Hình 7.7 Bước 2 của một trình*dịch hợp ngữ đơn giản 

Cho tới đây ta vẫn giả sử chương trình nguồn không cỏ bất kỳ 
một lỗi nào. Bất kỳ ai đã từng viết chương trình dù bằng ngôn ngữ 
nào đều biết giả định đó có tính thực tê ra sao. Một sô lỗi thường 
gặp như sau : 

1. Sử dụng ký hiệu nhưng không định nghĩa 

2. Định nghĩa một ký hiệu nhiều hơn một lần 

3. Tên trong trường opcode không phải là một opcode hợp 
lệ 
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4. Opcode không được cung cấp đủ toán hạng 

5. Opcode được cung câ'p có quá nhiều toán hạng 

6. Sô' dạng cơ sô' 8 lại chứa sô' 8 hoặc 9 

7. Dùng thanh ghi không hợp lệ ( thí dụ nhảy tới một 
thanh ghi ) 

8. Thiếu phát biểu END 

Các lỗi ký hiệu chưa định nghĩa thường được gây ra do lỗi đầnh 
máy, vì thế một trình dịch hợp ngữ thông minh có thể đoán ra ký 
hiệu nào trong những ký hiệu đã định nghĩa giông với ký hiệu chưa 
định nghĩa nhất và sử dụng thay vào đó. ít khi có sự hiệu chỉnh 
đúng cho hầu hết những lỗi khác. Điều tốt nhât đối với trình dịch 
hợp ngữ khi có một phát biểu sai là in một thông báo lỗi và thử 
tiếp tục hợp dịch. 

7.2.4 Bảng ký hiệu 

Trong suốt bước 1 của quá trình hợp dịch, trình dịch hợp ngữ 
tích lũy thông tin về các ký hiệu và các giá trị của chúng phải được 
cất trong bảng ký hiệu để được tìm kiếm trong bước 2. Nhiều 
phương pháp khác có thể sử dụng để tổ chức bảng ký hiệu. Ta sẽ 
mô tả tóm tắt một số phương pháp dưới đây. Tất cả đều cố gắng mô 
phỏng một bộ nhớ kết hợp ( associative memory ) dựa trên khái 
niệm một tập các cặp ( ký hiệu, giá trị ). Cho biết ký hiệu, bộ nhớ 
kết hợp phải tạo ra giá trị. 

Phương pháp hiện thực đơn giản nhât là thay vì hiện thực bảng 
ký hiệu như là một dảy các cặp, phần tử thứ nhất là ( hoặc trỏ tới ) 
ký hiệu và phần tử thứ hai là ( hoặc trỏ tới ) giá trị. Cho trước một 
ký hiệu để tìm kiếm, thường trình bảng ký hiệu chỉ tìm kiếm bảng 
một cách tuyến tính cho tới khi tìm thấy một giá trị thích hợp. 
Chương trình cho phương pháp này dề thực hiện nhưng có tốc độ 
chậm bởi vì, tính trung bình, mỗi lần tìm kiếm chương trình phải 
tìm kiếm trên một nửa bảng. 

Một phương pháp khác để tổ chức bảng ký hiệu là xếp thứ tự 
bảng trên các ký hiệu và dùng thuật toán tìm kiếm nhị phân 
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( binary search ) để tìm kiếm một ký hiệu. Thuật toán này làm việc 
bằng cách so sánh điểm nhập ở giữa trong bảng với ký hiệu đó. 
Nếu ký hiệu đứng trước điểm nhập ở giữa theo thứ tự chữ cái, ký 
hiệu được đặt ở nửa trước của bảng. Nếu ký hiệu đứng sau điểm 
nhập ở giữa bảng, ký hiệu ở nửa thứ hai của bảng. Nếu ký hiệu 
bằng với điểm nhập ở giữa, việc tìm kiếm kết thúc. 

Giả thiết là điểm nhập ở giữa bảng không bằng với ký hiệu cần 
tim, ít nhất ta biết nửa nào của bảng cần tìm kiếm. Tìm kiếm nhị 
phân bây giờ được áp dụng cho nửa đúng, là nửa sinh ra hoặc một 
sự phù hợp hoặc một phần tư dúng của bảng. Áp dụng giải thuật đệ 
qui, một bảng có kích thước n điểm nhập có thê được tìm kiếm 
trong khoảng log 2 n lần thử. Rõ ràng phương pháp này nhanh hơn 
phương pháp tìm kiếm tuyến tính nhiều nhưng lại yêu cầu một 
bảng ký hiệu đã được sắp xếp thứ tự. 

Một phương pháp hoàn toàn khác để mô phỏng một bộ nhớ kết 
hợp là một kỹ thuật gọi là hash coding ( mã hóa cắt vụn ). Phương 
pháp này yêu cầu phải có một hàm “ hash ” ( cắt vụn ) ánh xạ các 
ký hiệu với các sô" nguyên trong dãi từ 0 tới k - 1. Một hàm có thể 
thực hiện là nhân mã ASCII của các ký tự trong các ký hiệu với 
nhau, bỏ qua tràn và lây kết quả modulo k, Thực tế, hầu như bất kỳ 
hàm nào của dữ liệu nhập đều cho một sự phân bố đơn điệu các giá 
trị hash ( hash value ). Các ký hiệu có thể được cất trong một bảng 
bao gồm k bucket ( vùng nhớ dữ liệu ) đánh sô từ 0 tới k - 1. 

Tất cả các cặp ( ký hiệu, giá trị ) mà ký hiệu của chúng được cắt 
vụn tởi i được cất trên một danh sách liên kết được trỏ tới bởi khe 
( Slot ) i trong bảng hash. Với n ký hiệu và k khe trong bảng hash, 
danh sách sẽ có chiều dài trung bình là n/k. 

Bằng cách chọn k xấp xỉ bằng n, các ký hiệu có thể được xác 
định trung bình chỉ khoảng một lần tìm kiếm. Bằng cách điều 
chỉnh k ta có thể giảm kích thước bảng nhưng tốc độ tìm kiếm sẽ 
chậm hơn. 

Phương pháp mã hóa cắt vụn được minh họa trong hình 7.8. 
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Hash 


Symbol 

Value 

coda 

andy 

14025 

0 

cerlel 

45012 

5 

ed 

34004 

2 

han* 

45019 

2 

henrl 

45009 

7 

jaco 

15015 

0 

Jim 

14013 

2 

|ohn 

25014 

1 

marja 

34101 

3 

martln 

25014 

3 

peter 

25018 

1 

reind 

14004 

4 

ruud 

34004 

6 

sape 

24005 

6 

wlebren 

24014 

1 


(a) 



<b) 


Hình 7.8 Hash coding (a) Các ký hiệu, giá trị và mã ỉiash nhận được từ 
các ký hiệu (b) Bảng hash 8 điểm nhập với các danh sách cua các ký hiệu 

được liên kết và các giá trị 
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73 MACRO 

Những người lập trình hợp ngừ thường xuyên cần lặp lại các 
chuỗi chỉ thị nhiều lần trong chương trình. Phương pháp hiển nhiên 
nhất, đơn giản chỉ phải viết những chỉ thị yêu cầu mỗi khi cần đến. 
Tuy nhiên, nếu chuỗi chỉ thị dài hoặc phải sử dụng rất nhiều lần, 
việc ghi đi ghi lại các chỉ thị sẽ trở nên nhàm chán. 

Một phương pháp khác là thiết lập chuỗi chỉ thị đó vào trong 
một thủ tục và gọi thủ tục mỗi khi cần đến. Chiến lược này có điểm 
bất lợi là cần có một chỉ thị gọi thủ tục và một chỉ thị trở về dược 
thực thi mỗi lần cần đến chuỗi chỉ thị đó. Nếu các chuỗi ngắn, thí 
dụ có 2 chỉ thị nhưng được dùng thường xuyên, chi phí cho việc gọi 
thủ tục làm giảm có ý nghĩa tốc độ thực thi chương trình. Các 
macro cung câp một giải pháp dễ dàng và hiệu quả cho vấn đề cần* 
lặp lại các chuồi chỉ thị giống nhau hoặc gần giông nhau. 

7.3.1 Định nghĩa, gọi và mở rộng macro 

Đinh nghĩa macro là phương pháp cung cấp tên cho một phần 
của chương trình. Sau khi một macro đã được định nghĩa, người lập 
trình có thể viết tên macro thay cho phần của chương trình. Thực 
tế, macro là sự viết tắt cho phần đó của chương trình. Hình 7.9(a) 
trình bày một chương trình hợp ngữ viết cho 80386 dể trao đổi nội 
dung của các biến p và Q 2 lần. Các chuỗi này có thể được định 
nghĩa như một macro trình bày trong hình 7.9(b). Sau khi định 
nghĩa, mỗi lần xảy ra SWAP đều khiến cho chương trình được thay 
thế bằng 4 dòng lệnh : 

MOV EAX,P 
MOV EBX,Q 
MOV Q,EAX 
MOV P,EBX 

Người lập trình đã định nghĩa SWAP như là sự viết tắt cho 4 
phát biểu trình bày ở trên. 
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£1 


MOV EAX.P 

SWAP MACRO 

MOV EBX.Q 

MOV EAX,P 

MOV Q, EAX 

MOV EBX,Q 

MOV P.EBX 

MOV Q.EAX 

• 

MOV P,EBX 

MOV EAX.P 

ENDM 

MOV EBX,Q 

• 

MOV Q,EAX 

SWAP 

MOV P,EBX 

* 


SWAP 

(a) 

(b) 


Hình 7.9 Mả hợp ngữ của Intel 80386 để thực hiện trao đổi p và Q 2 lần 
(a) Khống có macro (b) Có macro 

Mặc dù các trình dịch hợp ngữ khác nhau có các ký hiệu hơi 
khác nhau cho dinh nghĩa macro, nhưng tất cả đều yêu cầu những 
phần cơ bản giống nhau trong một định nghĩa macro : 

1. Tiêu đề macro ( macro header ) cho biết tên của macro được 
định nghĩa 

2. Vãn bản bao gồm phần thân của macro 

3. Một giả chỉ thị dánh dấu điểm kết thúc của định nghĩa 
macro ( ENDM chẳng hạn ) 

Khi trình dịch hợp ngữ gặp một định nghĩa macro, trình này cất 
macro vào bảng định nghĩa macro để dùng sau này. Từ lúc đó, mỗi 
khi tên macro ( SWAP trong thí dụ ở hình 7.9 ) xuất hiện như là 
một opcode, trình dịch hợp ngữ thay thế tên này bằng phần thân 
của macro. Sử dụng tên macro như là opcode được gọi là lời gọi 
macro ( macro call ) và việc thay thế tên macro bằng phần thân của 
macro được gọi là mở rộng macro ( macro expansion ). 
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Sự mở rộng macro xảy ra trong thời gian của quá trình hợp dịch 
và không xảy ra trong thời gian thực thi chương trình. Điểm này 
rất quan trọng. Chương trình ở hình 7.9(a) và ở hình 7.9(b) sẽ sinh 
ra mã ngôn ngữ máy giống hệt nhau. Nếu chỉ xem xét chương trình 
ngôn ngữ máy, không thể biết có một macro nào được gọi trong lúc 
tạo chương trình này hay không, bởi vì sự mở rộng macro đã được 
hoàn tất và định nghĩa macro đã bị bỏ đi vào lúc chương.trình được 
hợp dịch. 


Việc gọi macro không nên bị lầm lẫn với việc gọi thủ tục. Điều 
khác nhau cơ bản là gọi macro là một dấu hiệu báo cho trình dịch 
hợp ngừ thay thế tên macro bằng phần thân của macro. Gọi thủ tục 
là một chỉ thị máy được chèn vào chương trình đôi tượng ( object 
program ) và sẽ được thực thi sau để gọi thủ tục. Hình 7.10 so sánh 
việc gọi macro với việc gọi thủ tục. 


Hạng mục 

Gọi macro 

Gọi thủ tục 

Việc gọi dược thực hiện 
khi nào ? 

Trong khi hợp dịch 

Trong khi thực thi 
chương trình đối tượng 

Thân có được chèn vào 
chương trình đối tượng 
ở mỗi nơi tên xuất 
hiện không ? 

Có 

Không 

Chỉ thị gọi thủ tục có 
được chèn vào chương 
trình đôi tượng và được 
thực thi sau không ? 

Không 

Có 

Cần phải có chỉ thị trở 
về để điều khiển trở về 
phát biểu theo sau chỉ 
thị gọi ? 

Không 

Có 

Cổ bao nhiêu bản sao 
của thân xuất hiện 
trong chương trình đối 
tượng 

Một cho mỗi một lần 
gọi 

1 


Hình 7.10 So sánh việc gọi macro với việc gọi thủ tục 
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Mặc dù các macro thường được mở rộng trong bước 1 của quá 
trình hợp dịch, cũng có khái niệm suy nghĩ đơn giản hơn về trình 
dịch hợp ngữ như là có một bước phụ trước bước 1 trong thời gian 
các định nghĩa macro được cất và các macro được mở rộng. Theo 
cách nhìn này, chương trình nguồn được đọc và sau đó được đổi 
thành một chương trình khác trong đó tất cả dịnh nghĩa macro đều 
bị loại bỏ và trong đó tất cả lời gọi macro đều được thay thê bởi 
phần thân của macro. Chương trình kết quả, một chương trình hợp 
ngữ không có macro, sau đó được dưa vào trình dịch hợp ngữ. 

Điều quan trọng cần nhớ, chương trình là một chuỗi các ký tự 
bao gồm các chữ cái, chừ số, khoảng trống các dấu chấm câu, và trở 
về đầu dòng ( chuyển sang dòng mới ). Mở rộng macro bao gồm việc 
thay thế các chuỗi con ( substring ) nào đó của chuỗi này bằng các 
chuỗi ký tự khác. Tiện ích macro là phương pháp xử lý các chuỗi ký 
tự mà không chú ý đến ý nghĩa. 

7.3.2 Macro với các tham sô' 

Tiện ích macro đã mô tả ban đầu có thể được dùng để rút ngắn 
chương trình trong đó chuồi chỉ thị giông nhau xảy ra có tính lặp 
lại. Tuy nhiên, thường chương trình chứa nhiều chuỗi chỉ thị nhưng 
không hoàn toàn giống hệt nhau, như minh họa trong hình 7.11 (a). 
ơ đây chuỗi chỉ thị thứ nhất trao đổi các biến p và Q, trong khi 
chuỗi thứ 2 trao đổi các biến R và s. 

Các trình dịch hợp ngữ macro ( macro assembler ) xử lý trường 
hợp của các chuỗi gần giống nhau bằng cách cho phép các định 
nghĩa macro có các tham sô hình thức ( íormal parameter ) và cho 
phép các lời gọi macro cung câ'p các tham sô' thực ( actual 
parameter ). Khi một macro được mở rộng, mỗi tham số hình thức 
xuất hiện trong phần thân của macro được thay thế bởi tham số 
thực tương ứng. Các tham sô thực được đặt trong trường toán hạng 
của lời gọi macro. Hình 7.11(b) trình bày chương trình ở hình 
7.11(a) được viết lại bằng cách dùng macro với các tham sô'. 
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MOV EAX.P 
MOV EBX.Q 
MOV Q.ẼAX 
MỌV RÉBX 

m 

MỘV EẠX.R 
MOV EBX.S 
MÕy S.EAX 
MOV R.EBX 


CHANGE MACRO P1,P2 
MOV EAX,P1 
MOV EBX.P2 
MOV P2EAX 
MOV P1.EBX 
ENDM 

CHANGE p, o 

* 

è 

CHANGE R, s 


<a> 


<b) 


Hình 7.11 Các chuỗi phát biếu gần giống nhau (a) Không có macro (b) 

Có macro 

Các ký hiệu P1 và P2 là các tham 3(5 hình thức. Mỗi lần xuất 
hiện trong thân của macro, Pl dược thay thê bởi tham số thực thứ 
nhất khi macro được mở rộng. Tương tự, P2 được thay thế bởi tham 
số thực thứ hai. Trong lời gọi macro 


CHANGE p, Q 

P là tham số thực thứ nhất và Q là tham số thực thứ hai, vì vậy 
các chương trình có thể thực thi được tạo ra bởi cả 2 phần của hình 
7.11 đều giống nhau. 

7.3.3 Hiện thực tiện ích macro trong trình dịch hợp ngữ 

Để hiện thực một tiện ích macro, trình dịch hợp ngữ phải thực 
hiện được 2 chức năng : cất các định nghĩa macro và mở rộng các 
lời gọi macro. Chúng ta sẽ lần lượt xem xét 2 chức năng này. 

Trình dịch hợp ngữ phải duy trì một bảng tất cả các tên macro, 
cùng với mồi tên là một con trỏ trỏ tới dịnh nghĩa được lưu giữ sao 
cho có thể tìm lại được khi cần. Một sô trình dịch hợp ngữ có một 
bảng riêng cho các tên macro và một sô có bảng opcode kêt hợp 
trong đó chứa tất cả các chỉ thị máy, các giả chỉ thị và các tên 
macro. 

Khi gặp một định nghla macro, một điểm nhập của bảng được 
tạo ra cho biết tên macro, số của các tham số hình thức và một con 
trỏ trỏ tới một bảng khác, bảng định nghĩa macro, ở đó chứa thân 
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của macro. Danh sách của các tham số hình thức cũng được xây 
dựng lúc này để dùng trong việc xử lý định nghĩa. Sau đó thân của 
macro được đọc và cất vào bảng định nghĩa macro. Các tham sô 
hình thức xuất hiện trong thân của macro được xác định bởi một ký 
hiệu đặc biệt nào đó. Thí dụ, biểu diễn bên trong của định nghĩa 
macro CHANGE bằng dấu chấm phẩy là “ xuống dòng ” và ký hiệu 
& là ký hiệu của tham số hình thức được trình bày dưới đây : 

MOV EAX,&P1; MOV EBX,&P2; MOV &P2, EAX; 
MOV & Pl,EBX; 

Trong bảng định nghĩa macro, thân của macro đơn giản chỉ là 
một chuỗi ký tự. 

Trong thời gian bước 1 của hợp dịch, các opcode được tìm kiêm 
và các macro được mở rộng. Mỗi khi gặp một định nghĩa macro, 
định nghĩa này được cất vào bảng macro. Khi mọt macro được gọi, 
trình dịch hợp ngữ tạm thời dừng việc đọc dữ liệu nhập từ thiết bị 
nhập, thay vào đó khởi động việc đọc phần thân của macro đã được 
cất giữ. Các tham số hình thức lấy từ thân của macro đà cất giữ 
được thay bằng các tham số thực cung cấp trong lời gọi. Sự có mặt 
của dấu & trước các tham sô' hình thức làm cho trình dịch hợp ngữ 
dễ nhận ra chúng. 

7.4. LIÊN KẾT VÀ NẠP 

Đa số các chương trình đều có nhiều hơn một thủ tục. Các trình 
biên dịch và các trình dịch hợp ngữ thường dịch thủ tục tại một 
thời điểm và đặt thủ tục đã dịch lên đĩa. Trước khi chạy chương 
trình, tất cả các thủ tục đả dịch phải được tìm thây và liên kết với 
nhau một cách thích hợp. Nếu bộ nhớ ảo không sử dụng được, 
chương trình được liên kết dứt khoát phải được nạp vào bộ nhớ 
chính. Các chương trình thực hiện những chức năng này được gọi 
bằng các tên khác nhau, bao gồm trình liên kết ( linker ), trình 
nạp ( loader ), trình nạp liên kết ( linking loader ) và trình soạn 
thảo liên kết ( linkage editor ). Việc dịch đầy đủ một chương trình 
nguồn yêu cầu 2 bước nhự trình bày trong hình 7.12. 
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Hình 7.12 Tạo ra một mô-đun nạp tuyệt đối từ tập các thù tục nguồn được 
dịch độc lập yêu cầu sử dụng một trình liên kết 

Source procedure : thủ tục nguồn 
Translator : trình dịch 
Object module : mô-đun đối tượng 
Linker : trình liên kết 

Absoỉute load module : mô-đun nạp tuyệt đối 

1. Biên dịch hoặc hợp dịch các thủ tục nguồn 

2. Liên kết các mô-đun đôi tượng 

Bước thứ nhất được trình biên dịch hoặc trình dịch hợp ngữ thực 

hiện còn bước thứ hai được thực hiện bởi trình liên kêt. 

■ * ■ * 

Việc dịch từ thủ tục nguồn thành mô-đun đối tượng biểu diễn 
một thay dổi về cấp bỏi vì ngôn ngữ nguồn và ngôn ngừ đích có các 
chỉ thị và ký hiệu khác nhau. Tuy nhiên, quá trình liên kêt lại 
không biểu diễn sự thay đổi về cấp vì cả hai dữ liệu nhập và dừ liệu 
xuất của trình liên kết đều là các chương trình cho cùng một máy 
ảo. Chức năng của trình liên kết là tập hợp các thủ tục đã được 
dịch riêng rẽ và kết nối chúng lại với nhau để chạy như là một khối 
duy nhất, thường gọi là mô-đun nạp tuyệt đôi ( absolute load 
module ). Chức năng của trình nạp ( loader ) là nạp mô-đun nạp 
tuyệt đối vào bộ nhớ chính. Những chức năng này thường được kết 
hợp với nhau. 
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Trình biên dịch và trình dịch hợp ngữ dịch từng thủ tục nguồn 
như là một thực thể riêng rẽ vì một nguyên nhân hợp lý. Nếu trình 
biên dịch hay trình dịch hợp ngữ đã đọc một chuỗi các thủ tục 
nguồn và trực tiếp sinh ra một chương trình ngôn ngữ máy sẵn 
sàng hoạt động ( ready-to-run ), sự thay đổi một phát biểu trong 
một thủ tục nguồn sè yêu cầu tất cả thủ tục nguồn phải được dịch 
lại. 

Nếu sử dụng phương pháp mô-đun đối tượng riêng của hình 7.12 
ta chỉ cần dịch lại thủ tục đâ sửa đổi mặc dù cần phải liên kết lại 
tất cá các mô-đun đôi tượng lần nữa. Tuy nhiên, việc liên kết 
thường nhanh hơn việc dịch nhiều nên quá trình dịch và liên kết 2 
bước có thể tiết kiệm được nhiều thời gian trong lúc phát triển một 
chương trình lớn. 

7.4.1 Các nhiệm vụ được thực hiện bởi trình liên kết 

Lúc khởi động bước 1 của quá trình hợp dịch, bộ đếm vị trí chỉ 
thị ILC được thiết lập bằng 0. Bước này tương đương với giả thiết 
mô-đun đòi tượng sẽ được đặt ở địa chỉ ( ảo ) 0 trong thời gian thực 
thi. Hình 7.13 trình bày 4 mô-đun đôi tượng. Trong thí dụ này, mỗi 
mô-đun đều bắt đầu bằng chỉ thị JƯMP nhảy tới chỉ thị MOVE 
trong mô-đun. 

Để chạy chương trình, trình nạp mang các mô-dun đô'i tượng 
vào bộ nhớ chính như trình bày trong hình 7.14(a). Điển hình là 
một phần nhỏ của bộ nhớ bắt đầu ở địa chỉ 0 được dùng cho các 
vector ngắt, truyền thông với hệ điều hành và cho những mục đích 
khác, vì thế các chương trình phải bắt đầu ở địa chỉ lớn hơn 0. 
Trong hình vẽ này chúng ta đã bắt đầu ( tùy ý ) các chương trình ở 
địa chỉ 100. 

Mặc dù chương trình ở hình 7.14(a) đã nạp vào bộ nhớ chính 
nhưng chưa sẵn sàng thực thi. Hãy xem điều gì sẽ xảy ra nếu việc 
thực thi bắt đầu bằng chỉ thị ở đầu mô-đun A. Chương trình sẽ 
không nhảy téi chỉ thị MOVE như phải làm, bởi vì chỉ thị đó bây 
giờ ở địa chỉ 300. Thực tế, tất cả chỉ thị tham chiếu bộ nhớ đều sẽ 
hoạt động sai với cùng một nguyên nhân. 
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Hình 7.13 Mỗi mô-đun đều có không gian địa chỉ riêng, bắt đầu ờ địa chi 0 

Vấn đề này, gọi là vấn đề tái định vị ( relocation problem ), xảy 
ra do bởi mỗi mô-đun đôi tượng trong hình 7.13 đều có một không 
gian địa chỉ riêng. Trên một máy với không gian địa chỉ có phân 
đoạn, như MƯLTICS, mỗi mỏ-đun đối tượng có thể có không gian 
địa chỉ riêng do dược đặt trong segment riêng. Trên một máy với bộ 
nhớ 1 chiều và tuyến tính, các mô-đun đối tượng phải được kết hợp 
thành một không gian địa chỉ duy nhất. Tính chất 2 chiều cua bộ 
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nhớ ảo MƯLTICS loại bỏ nhu cầu phải kết hợp các mô-đun đốì 
tượng và đơn giản hóa rất nhiều nhiệm vụ của trình liên kết. 
Không gian địa chỉ riêng biệt của các mô-đun đối tượng cũng phải 
được kết hợp trên một máy có bộ nhớ ảo một chiều và được phân 
trang, 

Hơn nữa, các chỉ thị gọi thủ tục trong hình 7.14(a) cũng không 
làm việc, ơ địa chỉ 400, người lập trình có ý định gọi mô-đun đôi 
tượng B, nhưng bời vì mỗi thú tục được dịch riêng, trình dịch hợp 
ngữ không có cách nào biết địa chỉ nào được chèn vào chỉ thị CALL. 
Địa chỉ của mô-đun đôi tượng B sẽ không được biết cho tới lúc liên 
kết. Vân đề này được gọi là vấn đề tham chiếu ngoài ( external 
reterence ). Cá 2 vấn đề này được giải quyết bởi trình liên kết. 

Trình liên kết kết hợp các không gian địa chỉ riêng rẽ của các 
mô-đun đôi tượng thành một địa chỉ tuyến tính theo các bước sau 
đây : 

1. Xây dựng một bảng tất cả mô-đun đôi tượng và chiều dài. 

2. Dựa vào bảng này, gán địa chỉ nạp cho từng mô-đun đối 
tượng. 

3. Tìm tát cả các chi thị chứa địa chỉ bộ nhớ và cộng từng địa 
chí bộ nhớ này với một hằng sô" tái định vị ( relocation 
constant ), hằng sô này bằng với địa chỉ bắt đầu của mô- 
đun. 

4. Tìm tất cả các chi thị tham chiếu tới những thủ tục khác và 
chèn địa chỉ của nhừng thủ tục này đúng chỗ. 

Báng mô-đun đôi tượng xây dựng ở bước 1 cho các mô-đun của 
hình 7.14 như sau : 


Mô-đun 

A 

B 

c 

D 


Chiều dài 
400 
600 
500 
300 


Địa chỉ bắt đầu 
100 
500 
1100 
1600 
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\ 
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1400 


ì 

1500 

CALL D 
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D 
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'ấ 
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Obịect 

module 

A 


Object 

module 

B 


Object 

module 

c 


Object 

module 

D 


(a) 


(b) 


Hình 7.14 (a) Các mô-đun đối tượng của hình 7.13 sau khi được nạp nhưng 
trước khi dược liên kết (b) Các mô-đun đối tượng sau khi liên kết. Chúng 
cùng hình thành một mô-đun nạp tuyệt đối và sần sàng hoạt động. 
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Hình 7,14(b) trình bày cách xem xét không gian địa chỉ của 
hình 7.14(a) sau khi trình liên kết thực hiện những bước này. 

7.4.2 Cấu trúc của mô-đun đối tượng 

Các mô-đun đôi tượng có 6 phần như trình trình bày trong hình 
7.15. Phần đầu tiên chứa tên của mô-đun, các thông tin được trình 
liên kết cần đến như : chiều dài của các phần khác nhau của mô- 
đun đôi tượng và đôi khi ngày hợp dịch. 

Phần thứ 2 của mô-đun đôi tượng là một danh sách các ký hiệu 
đã định nghĩa trong mô-đun mà những mô-đun khác có thề tham 
chiếu, cùng vđi những giá trị của chúng. Thí dụ nếu mô-đun bao 
gồm một thủ tục có tên BIGBƯG, bảng điểm nhập ( entry point 
table ) sẽ chứa chuỗi ký tự “ BIGBƯG ” theo sau là địa chỉ tương 
ứng. Người lập trình hợp ngữ xác định những ký hiệu nào được khai 
báo như điểm nhập ( entry point. ) hoặc ký hiệu ngoài ( external 
Symbol ) bằng cách dùng một giả chỉ thị. 

Phần thứ 3 cúa mô-đun đối tượng bao gồm một danh sách các 
ký hiệu được sứ dụng trong mô-đun nhưng được định nghĩa trong 
các mô-đun khác, cùng với một danh sách các chỉ thị máy nào sử 
dụng nhừng ký hiệu nào. Trình liên kết cần danh sách sau để có 
thể chèn các địa chỉ đúng vào các chỉ thị sử dụng các ký hiệu ngoài. 
Một thù tục có thế gọi các thú tục được dịch độc lập khác bằng cách 
khai báo tên cúa những thú tục được gọi là ngoài ( external ). Người 
lập trình hợp ngừ xác định những ký hiệu nào được khai báo là 
ngoài ( external ) bằng cách dùng một giả chỉ thị. Trên một số máy 
tính, bảng điểm nhập và bảng tham chiếu ngoài ( external 
reíerence table ) được kết hợp thành một bảng duy nhất. 

Phần thứ 4 của mỏ-đun đôi tượng là mã đã hợp dịch và các 
hằng sô' ( assembled code and constants ). Phần này của mô-đun đối 
tượng là phần duy nhất sè được nạp vào bộ nhớ để được thực thi. 5 
phần kia được trình liên kết sứ dụng và sau đó được loại bỏ trước 
khi bắt đầu thực thi. 

Phần thứ 5 của mô-đun đối tượng là từ điển tái định vị ( re- 
location dictionary ). Như trình bày trong hình 7.14, các chỉ thị có 
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chứa các địa chỉ bộ nhớ phải dược cộng thêm hằng sô tái định vị. Vì 
trình liên kết không có cách nào cho biết ngoài sự kiểm tra từ dữ 
liệu nào trong sô các từ dữ liệu trong phần thứ 4 chứa chỉ thị máy 
và từ nào chứa hằng sô', nên thông tin về nhừng địa chỉ nào được 
tái định vị được cung cấp trong bảng này. Thông tin có thế theo 
dạng của một bảng bit, với 1 bit cho một địa chi có khả nàng tái 
định vị, hoặc một danh sách cụ thế các địa chỉ được tái định vị. 


Identitication 


Entry point table 


External relerence table 


Machine instructions 
and constants 


Relocation 

dictionary 


End of module 


Hình 7.15 Cấu trúc bên trong cùa một mỏ-clun đôi tượng tạo ra bới một 

trình dịch 

Identiíìcation : nhận dạng 

Entry point table : báng điểm nhập 

External reĩerence table : bảng tham chiếu ngoài 

Machine instructions and constants : các chỉ thị máy và các hàng sô 

Relocation dictionary : từ điên tái định vị 

End of module : kết thúc mô-đun 

Phẩn thứ 6 là một dâu hiệu kết thúc mô-đun ( end of module ), 
đôi khi là một kiểm tra tổng ( checksum ) đế bắt các lỗi tạo ra 
trong lúc đọc mô-đun và địa chỉ tại đó bắt đầu thực thi. 

Đa sô các trình liên kêt có 2 bước. Trong bước 1 trình liên kêt 
đọc tâ't cả các mô-đun đối tượng và xây dựng một bảng gồm tên các 
mô-đun và các chiều dài và một bảng ký hiệu toàn cục bao gồm tất 
cả các điểm nhập và các tham chiếu ngoài ( external reference ). 
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Trong bước 2 các mô-đun đối tượng được đọc, được tái định vị và 
dược liên kết thành một mô-đun. 

7.4.3 Thời gian kết và việc táỉ định vị động 

Trong một hệ thông phân chia thời gian, chương trình có thể 
được đọc vào bộ nhớ chính, chạy trong một thời gian ngắn rồi được 
ghi lẽn đĩa, sau đó được đọc trở lại vào bộ nhớ chính đế chạy lần 
nữa. Trong hệ thông lớn với nhiều chương trình, thật khú báu đám 
một chương trình được đọc trơ lại ở các vị tri gimig nhau cho mồi 
lần đọc. 

Hình 7.16 trinh bày diểu gi sẽ xảy ra nếu chương trình đâ được 
tái định vị của hình 7.14(b) được nạp lại ớ địa chỉ 400 thay vì địa 
chi 100 nơi trình liên kết ban đầu đá đặt. Tất cả các địa chỉ bộ nhớ 
đều sai ; va lại thông tin tái định vị dã được loại bỏ từ lâu. Thậm 
chí nếu thông tin tái định vị vẫn còn sử dụng đuợc, giá của việc tái 
định vị tất cá địa chỉ mỗi lần chương trình được trao đổi sẽ rất cao. 

Vân đề di chuyển các chương trình đâ được liên kết và tái định 
vị có liên quan mật thiết đến thời gian tại đó sự kết ( binding ) cuối 
cùng các tên ký hiệu lên các địa -chỉ bộ nhớ vật lý tuyệt đôi được 
hoàn tát. Khi một chương trình được viết, chương trình có chứa các 
tên ký hiệu cho các địa chi bộ nhớ, thí dụ JƯMP L, thời gian tại đó 
địa chi thực sự bộ nhớ chính tương ứng với L được xác định gọi là 
thời gian két ( binding time ). Thời gian kết có ít nhât 6 khả năng 
sau : 

1. Khi chương trình được viết 

2. Khi chương trình được dịch 

3. Khi chương trình dược liên kêt nhưng trước khi được nạp 

4. Khi chương trình được nạp 

5. Khi thanh ghi nền ( dùng để định địa chỉ ) được nạp 

Khi lệnh có chứa địa chỉ được thưc thi 

* m * 


6, 
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Hình 7.16 Mô-đun nạp tuyệt đô'i của hình 7.14(b) di chuyển đi 300 địa chỉ 
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Nếu chi thị chứa địa chí bộ nhớ được di chuyển sau khi kết, địa 
chỉ này sẽ sai ( giá thiết là đối tượng được tham chiếu cũng được di 
chuyên ). Nếu trình dịch tạo ra một mô-đun nạp tuyệt đôi ( absolute 
load module ), việc kết xảy ra tại thời điểm dịch và chương trình 
phái chạy ớ địa chi mà trình dịch muốn. Phương pháp liên kết đã 
mỏ tá trong phấn trước kết các tén ký hiệu với các địa chi tuyệt đối 
trong thời gian liên kết, đó là -lý do tại sao việc di chuyên các 
chương trình sau khi liên kết bị thất bại, như trình bày trong hình 
7.16. 

Hai vấn đề có liên quan được bao gồm ở đây. Thứ nhất, có vấn 
đẻ khi các tên ký hiệu được kết với các địa chỉ ảo. Thứ hai, có vấn 
đè khi các địa chi áo dược kẽt với các địa chí vật lý. Chỉ khi cả 2 
thao tác này xay ra việc kết mới hoàn tất. Khi trình liên kết kết 
hợp các không gian địa chỉ riêng biệt của các mô-đun đồi tượng 
thành một khổng gian địa chi tuyến tính duy nhất, không gian địa 
chi ao dược tạo ra. Sự tái định vị và liên kết dùng đế kết các tên 
ký hiệu lèn các địa chi ảo cụ thể. Nhận xét này đúng cho dù bộ nhớ 
áo có dang được sứ dụng hay không. 

Giá sứ lúc đó không gian địa chỉ cùa hình 7.14(b) được phân 
trang. Rỏ ràng là các địa chỉ ảo tương ứng với các tên ký hiệu A, B, 
c và D đà được xác định, mặc dù các địa chỉ của bộ nhớ chíhh vật 
lý sẽ tùy thuộc vào nội dung cũa bảng trang tại thời điểm chúng 
được sử dụng. Một mô-đun nạp tuyệt đôi thực ra là sự kết của các 
tên ký hiệu lên các địa chỉ ảo. 

Bât kỳ cơ chẽ nào cho phép ánh xạ các địa chỉ ảo lên dịa chỉ bộ 
nhớ chính vật lý được thay đối dề dàng sẽ tạo dễ dàng cho việc di 
chuyên các chương trình trong bộ nhớ chính, ngay sau khi chúng 
được kết với không gian địa chi ảo. Một cơ chế như vậy là cơ chế 
phan trang ( paging ). Sau khi chương trình đươc chuyển vào bộ nhớ 
chinh, ta chi cán thay đòi bảng trang, không cần thay đổi chính 
chương trình. 

Cơ chẻ thứ hai dùng một thanh ghi tái định vị thời gian chạy 
( run-time như thanh ghi cs trên các CPU của Intel. Trên những 
máy dùng phương pháp tái định vị này, thanh ghi luôn luôn trỏ tới 
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địa chỉ bộ nhớ vật lý bắt dầu cùa chương trình hiện tại. Tất cá địa 
chỉ bộ nhớ có thanh ghi tái định VỊ được cộng với chúng bởi phần 
cứng trước khi được gởi tới bộ nhớ. Toàn bộ quá trình tái định vị là 
trong suôt đối với các chương trình cùa người sử dụng. Thậm chí họ 
không biết điều gì đang xảy ra. Khi chương trình được di chuyến, 
hệ điều hành phải cập nhật thanh ghi tái định vị. Cơ ché này ít 
phổ biến hơn cơ chẽ phân trang bời vì toàn bộ chương trình phải 
■được di chuyển như là một thể thống nhất ( trừ phi có thanh ghi tái 
địjih vị mã và dữ liệu riêng, trong trường hợp đó ta có 2 khôi riêng 
được di chuyên ). 

Cơ chê thứ 3 có thể có trên những máy có tham chiếu tới bộ 
nhớ liên qu. ,n đến bộ đêm chương trình, như các CPU 680x0. Mỗi 
khi chương trình được di chuyền vào bộ nhớ chính, chi có bộ đếm 
chương trình được cập nhật. Một chương trình mà tảt cả tham chiêu 
bộ nhớ hoặc liên quan tới bộ đếm chương trình hoặc là tuyệt đôi 
( thí dụ đối với các thanh ghi cùa thiết bị I/O ớ các địa chi tuyệt 
đối ) được gọi là độc lập vị trí ( position-independent ). Thú tục độc 
lập vị trí có thể được đặt vào bất cứ nơi nào trong không gian địa 
chỉ ảo mà không cần tái định vị. 

7.4.4 Liên kết động 

Phương pháp liên kết đã thảo luận trong phần 7.4.1 có đặc tính 
là tất cả thủ tục mà chương trình có thế gọi được liên kẽt trước khi 
chương trình bắt đầu được thực thi. Trên máy tính có bộ nhớ ảo, 
việc hoàn tất mọi liên kết trước khi bắt đầu thực thi chương trình 
không phải là điều thuận lợi đôi với toàn bộ khả năng của bộ nhớ 
ảo. Nhiều chương trình có nhừng thú tục chỉ được gọi dưới những 
tình huống bất thường. Thí dụ các trình biên dịch có các thú tục đé 
biên dịch những phát biểu ít sử dụng, cộng với những thủ tục điều 
khiển các điều kiện lỗi hiếm khi xay ra. 

Một phương pháp linh động hơn đê liên kẻt các thú tục dược 
biên dịch riêng rẽ là liên kết từng thù tục tại thời đièm được gọi 
lần đầu tién. Quá trình này được gọi là liên kết động < dynamic 
linking ). Phương pháp này được MULTICS khám phá và được OS/2 
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A procedure segment : một segment của thù tục 
Indirect addressing : định địa chỉ gián tiếp 
The linkage segment : segment liên kết 
Indirect word : từ gián tiếp 

Linkage iníbrmation for the procedure AIR : thông tin liên kết cho thu tục 
AIR 

Name of the procedure is stored as a character string : tên cùa thu tục được 
cất như là một chuỗi ký tự 
Invalid address : địa chỉ không hợp lệ 
To EARTH : đến EARTH 

sử dụng. Có hai cách hiện thực hơi khác nhau nên chúng ta sẽ tháo 
luận cả 2. 

Trong MƯLTICS, kết hợp với mỗi chương trình là một segment , 
được gọi là segment liên kết ( linkage segment ), chứà một khỏi 
thông tin cho mỗi thu tục có thế được gọi. Khôi thông tin này bắt 
đầu bằng một từ dành riêng cho địa chỉ ảo của thủ tục, tiếp theo 
sau là tên thư tục được cât như là một chuỗi ký tự. 

Khi sử dụng liên kết động, các chỉ thị gọi thủ tục trong ngôn 
ngữ nguồn được dịch thành các chỉ thị gián tiếp địa chỉ hóa từ đầu 
tiên của khối liên kết tương ứng, như trình bày trong hình 7.17(a). 
Trình biên dịch làm đầy từ này hoặc bằng một địa chỉ không hợp lệ 
hoặc bằng một mẫu bit đặc biệt mà bắt buộc sè gây ra bảy. 

Khi gọi thu tục trong một thanh ghi khác, việc thứ địa chi hóa 
từ không hợp lệ sẽ gián tiếp gây ra bầy tới trình liên kêt động 
( dynamic linker ). Trình liên kết tìm chuỗi ký tự trong từ theo sau 
địa chĩ không hợp lệ và tìm kiếm thư mục tập tin cúa người sứ dụng 
đối với thủ tục đã được biên dịch bằng tên này. Kê tiêp thù tục đó 
gán một địa chỉ ảo, thường ở trong segment riêng của thủ tục, địa 
chỉ ảo này ghi đè lên địa chỉ không hợp lệ trong segment liên kết 
như trong hình 7.17(b). Kế tiếp, chỉ thị gây ra lỗi liên kết ( linkage 
fault ) được thực thi lại, cho phép chương trình tiếp tục từ nơi trước 
khi có bẫy. 

Tất cả tham chiếu tiếp theo đến thu tục sẽ được thực thi mà 
không gây ra một lỗi liên kết nào, với từ gián tiếp ( indirect word ) 
bây giờ chứa một địa chỉ ảo hợp lệ. Kết quả là trình liên kết động 
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chi được yêu cầu ở lần gọi thủ tục đầu tiên và sau đó không được 
yêu cầu nừa. 

Sơ đồ liên kết động của OS/2 tổng quát hơn sơ đồ của 
MULTICS. Người lập trình trẽn OS/2 thậm chí không phải biết tên 
của tât cả thủ tục mà chương trình sẽ gọi sau này. Hảy khảo sát thí 
dụ sau đây. Trong hệ thống ngân hàng phân bố ( distributed 
banking System ), một máy trung tâm -thu nhận các yêu cầu từ các 
thiết bị đầu cuối ở xa để thực hiện các giao dịch. Lúc hệ thông được 
thiết kế, người ta muốn có những loại giao dịch mới sẽ được thêm 
vào khi hệ thông phát triền dần lên. 

Để cho phép hệ thông phát triển, người ta quyết định trước 
rằng môi giao dịch sẽ có một tên và mỗi giao dịch sẽ được tiến 
hành bới một thu tục được đặt tên theo giao dich đó. Mã thực thi 
cho thủ tục này sẽ được cất như là một tập tin có cùng tên, trong 
một thư mục đặc biệt. 

Khi thiêt bị đầu cuôi từ xa gởi một thông điệp tới máy tính 
trung tâm, tên của giao dịch bao gồm trong thông điệp, Chương 
trình giao dịch xây dựng tên của tập tin chứa mã có liên quan và 
tạo ra một lời gọi hệ thông yêu cầu hệ điều hành định vị tập tin 
này và mang tập tin vào bộ nhớ. Sau đó chương trình giao dịch tạo 
ra một lời gọi thứ hai yêu cầu hệ điều hành tìm và trả về cho 
chương trình giao dịch địa chỉ bắt đầu của thủ tục mà chương trình 
giao dịch cần đên ( tập tin có thể chứa nhiều thủ tục ). Chương 
trình chính gọi thủ tục với địa chỉ được trang bị này ( thực ra là 
một bộ chọn segment và một offset ). Các lời gọi tiếp theo tới cùng 
thù tục được thực hiện theo cách bình thường, không có một lời gọi 
hệ thống nào. 

Rõ ràng sơ đổ này tạo khá năng thêm những thủ tục mới cho 
chương trình đang chạy chỉ bằng cách biên dịch mã đối tượng có 
liên quan và đặt vào một nơi nào đó trên đĩa. Thậm chí chương 
trình đang chạy không cần biết trước đó thủ tục ở đâu vì thông tin 
này được chứa trong thông' điệp gởi tới chương trình, cũng không 
cần yêu cầu chương trình phải dừng sự thực thi để được biên dich 
lại. 
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7.5 TÓM TẮT 

Mặc dù đa sô các chương trình đều có thể và nên được viết bằng 
ngôn ngữ cấp cao, nhưng thỉnh thoảng cũng có những trường hợp 
cần phải viết bằng hợp ngữ, ít nhâ't trong một phần nào dó. Chương 
trình hợp ngữ là một biểu diễn ký hiệu cho một chương trình ngôn 
ngừ máy nhấn mạnh nào đó. Chương trình hợp ngữ được dịch 
thành ngôn ngử máy bằng một chương trình gọi là trình dịch hợp 
ngữ. 

Những nghiên cứu khác nhau cho thấy khi cần thực hiện nhanh, 
phương pháp tốt hơn việc viết mọi thứ bằng hợp ngữ là trước tiên 
viết toàn bộ chương trình bằng ngôn ngừ cấp cao, sau đó đo đạc 
xem phần nấo trong chương trình làm tôn nhiều thời gian và cuối 
cùng chỉ viết lại những phần này cùa chương trình, những phần 
được sử dụng nhiều. Trong thực tế, phần nhỏ của mả thường chịu 
trách nhiệm đối với phần lớn của thời gian thực thi. 

Đa sô các trình dịch hợp ngữ đều có 2 bước. Bước 1 dành cho 
việc xây dựng một bảng ký hiệu cho các nhãn, các ỉiteral và những 
ký hiệu nhận dạng đã khai báo cụ thể. Các ký hiệu có thể hoặc 
được giữ không sắp xếp thứ tự và sau đó tìm kiếm một cách tuyến 
tính, hoặc được xếp thứ tự trước và sau đó tìm kiếm nhờ vấo 
phương pháp tìm kiếm nhị phân hoặc bằng phương pháp cắt vụn 
( hashed ). Nếu các ký hiệu không cần xóa trong thời gian bước 1, 
cắt vụn thường là phương pháp tốt nhát. 

Bước 2 thực hiện việc tạo mã. Một sô' giả chỉ thị được thực hiện 
trong bước 1 và một sô' khác được thực hiện trong bước 2. 

Nhiều trình dịch hợp ngữ có tiện ích macro cho phép người lập 
trình gán các chuỗi mâ thường được sử dụng bằng các tên ký hiệu 
cho các lần sử dụng sau. Thông thường, nhừng macro này có thể 
được tham số hóa bằng một phương pháp không phức tạp. Các 
macro được hiện thực bởi một loại giải thuật xử lý chuỗi lìteral. 

Các chương trình dược hợp dịch độc lập có thể được liên kết với 

nhau để hình thành một mô-đun nạp tuyệt đối. Công việc này được 

thưc hiên bởi trình liên kết. Nhiệm vụ chính của trình liên kết là 
• * * ■ 



@514 


Cấu trúc Máy tính 


tái định vị và kết các tên. Liên kết động là một kỹ thuật trong đó 
các thủ tục không được liên kết cho tới khi chúng thực sự được gọi. 
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CẤU TRÚC MÁY TÍNH NÂNG CAO 


Các máy chúng ta đã nghiên cứu trong 7 chương trước theo một 
nghĩa nào dó là các máy thuộc thê hệ mới, nhưng theo một nghĩa cơ 
bản hơn chúng chỉ đơn thuần là những phiên bản nhỏ hơn của các 
mainírame lớn được giới thiệu vào những năm 1960. Giống như họ 
IBM 360 ban đầu, 80386, 68030 và nhiều máy tính khác hiện nay 
đều có một CBƯ, một bộ nhớ ngoài, từ 8 tới 16 thanh ghi, hàng 
trăm chỉ thị và hàng chục hoặc nhiều hơn các kiểu định địa chỉ 
phức tạp. 

Gần đây đã có rất nhiều hoạt động liên quan đến các cấu trúc 
máy tính. Một số trong dó đà đem lại những thiết kế mới mang 
tính sáng tạo có thể cách mạng hóa câu trúc máy tính. 2 thiẽt kê có 
nhiều triển vọng cho tương lai là máy RISC và bộ xử lý song song. 

Chương này khảo sát chi tiết một trong hai triển vọng đó : máy 
RISC. 

Chúng ta sẽ bắt đáu nghiên cứu một trong những phát triển 
mới trong câu trúc máy tính bằng máy RISC ( RISC machine ). 
RISC là một từ được cấu tạo từ nhừng chữ đầu của Reduced 
Instruction Set Computer ( máy tính có tập chỉ thị thu gọn ) và có 
khuynh hướng là máy tương phản với máy CISC, nghĩa là Complex 
Instruction Set Computer ( máy tính có tập chỉ thị phức tạp ). IBM 
360 và tất cả các mainữame khác, DEC, VAX, Intel 80386 và 
Motorola 68030 là những thí dụ của máy CISC. 
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Nhừng người ủng hộ triết lý máy RISC cho rằng cần phải xem 
xét lại toàn bộ cách nghĩ về cấu trúc máy tính và gần như tất cả 
các máy quy ước đều có câú trúc cổ xưa. Họ tranh luận rằng các 
máy tính đã có quá nhiều phức tạp qua nhiều năm và nên bỏ chúng 
đi ( ít nhất là về những thiết kê ) và bắt đầu lại. Các ý kiến này đã 
tạo ra một sô' tranh cẵi và thảo luận nhưng cuối cùng không có kết 
luận nào được rút ra, Trpng mục này ta sẽ nghiên cứu chi tiết về 
các máy RISC và trình bày cả hai phía về cuộc tranh luận lớn giữạ 
máy RISC và máy CISC. 

8.1 Sự PHÁT TRIỂN CỦA CÂU TRÚC MÁY TÍNH 

Các máy tính sô' ban đầu là những máy cực kỳ đơn giản. Từ 
máy ENIAC tới IBM 7094 rồi tới CDC 6600, máy tính tương đôi đã 
có vài chi thị và chỉ có 1 hoặc 2 kiểu định địa chỉ. 

Tất ca đâ thay đổi một cách bâ't ngờ bằng sự mở đầu của loạt 
máy IBM 360 vào năm 1964. Tất cả các kiểu của loạt máy 360 đều 
được vi lập trình. Mặc dù các vi câu trúc của những kiểu 360 khác 
nhau không khó hiểu lắm, nhưng các vi chương trình chạy trên 
chúng được giới thiệu cho nhừng người sử dụng có một tập chỉ thị 
phức tạp ở cáp máy quy ước, mà người ta hiểu như là “ngôn ngừ 
máy” vì các vi chương trình ơ trong ROM và không thể thay đổi 
được. Chỉ trong vòng một vài năm, ngay cả các máy tính mini, như 
VAX, tiêu biểu đã có trên 200 chỉ thị và hàng chục kiểu định dịa 
chỉ, tất cá được thực hiện bởi một vi chương trình vẫn chạy trên 
một phần cứng đơn giản. 

Tiếp theo đó, ngay cả các bộ vi xử lý bắt đầu với cấu trúc nhỏ 
nhất, cũng ngày càng nhanh chóng tiến gần hoặc thậm chí vượt qua 
độ phức tạp của các máy tính mini và các mainírame. Khuynh 
hướng này được khích lệ bời việc sử dụng rộng rãi các ngôn ngữ câ'p 
cao. Các ngôn ngừ cấp cao chứa các cấu trúc như if, vvhile và case, 
trong khi các ngôn ngừ hợp dịch mà các chương trình trong những 
ngôn ngữ này ( cấp cao và hợp ngừ ) phải được dịch chứa các chỉ'thị 
như MOVE, ADD và JƯMP. Sự khác nhau về ngữ nghĩa ( semantic 
gap ) dẫn đến kết quầ là việc viết các trình biên dịch gặp khó 
khăn. 
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Vì việc làm giám thâp câp cúa các ngôn ngữ không phái là 
chuyện cần bàn, nên phương pháp phổ biến để giám sự khác nhau 
về ngữ nghĩa là tăng cấp “ngôn ngữ máy”. Các chỉ thị mới đế điều 
khiển các phát biếu case được thêm vào như là các kiểu định địa chi 
đặc biệt để xử lý dãy và mầu tin. Phần lớn các cơ chế gọi thú tục 
bao gồm truyền tham số, điều chỉnh stack và cất thanh ghi được 
chuyển thành vi mả. Hầu hết. mọi người đều xem khuynh hướng 
này có tính tích cực. Poster ( 1972 ) thậm chí đã viết ràng, ỏng ta 
kỳ vọng các máy trong tương lai sẽ gồm các chỉ thị có tới 6 trường 
và không có thanh ghi, làm giảm đi nhiều sự khác biệt về ngử 
nghĩa. 

Một yêu tô khác đả khích lệ sự phố biến các máy CISC là bộ 
nhớ có tốc độ tương đối chậm so với tốc độ của CPU. Đế hiếu tại 
sao điều này quan trọng như vậy, hãy xem các ứng dụng có yêu cảu 
sô" thập phân ( trái với sô nhị phân ) của COBOL. Bẽn trong tất cá 
máy tính đều là sỏ nhị phân, vì thế có 2 cách đề mô phóng sô thập 
phân. Cách thứ nhât là các chương trình COBOL gọi các thường 
trình thư viện trong bộ nhớ chính. Cách thứ hai là đặt các thường 
trình thư viện này trong vi chương trình và thêm các chỉ thị mới 
như ADD DECIMAL vào cấu trúc. Phương pháp đầu cần nhiều tham 
chiếu bộ nhớ ( chậm ) để tìm nạp các chí thị của thường trình thư 
viện; phương pháp thứ 2 tìm nạp thường trình thư viện từ ROM tốc 
độ nhanh bên trong CPU. Do những điều kiện này, sự cám dồ của 
việc đưa ngày càng nhiều chỉ thị phức tạp vào trong vi chương trình 
là điều hấp dẫn khóng thề cưỡng lại được. 

Vào những năm 1970, công nghệ bắt đầu thay đổi. Bộ nhớ bán 
dẫn RAM không còn chậm hơn ROM 10 lần nừa. Hơn nừa việc ghi, 
sửa sai và bảo trì tâ't cả các vi mã đã bắt dầu trờ thành vấn đề đau 
đầu. Sau cung, việc cô định con rệp ( chỉ chip ) vi mã cùng nghĩa với 
việc trang bị cho các kỹ sư phục vụ khách hàng những hộp lớn các 
ROM mới và các danh sách của hàng ngàn yéu cầu lắp đặt máy 
tính yêu cầu gắn chúng vào. 

Tệ hại hơn, những người theo phái trừu tượng đã bất đầu khao 
sát những chương trình thực tẽ đê xem những loại phát biểu nào 
thực sự được cất trong vi chương trình. Knuth ( 1971 ) dã đánh giá 
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các chương trình FORTRAN, Wortman ( 1972 ) đã chú ý đến các 
chương trình hệ thống viết bằng ngôn ngữ gông như PL/I gọi là 
XPL, Tanenbaum ( 1978 ) đã khảo sát mả của hệ điều hành được 
viết bằng ngôn ngữ giông như Pascal gọi là SAL, Patterson ( 1982 ) 
đã đánh giá các chương trình hệ thông viết bằng c và Pascal. 
Những kết quả này được trình bày trong hình 8.1. Cột cuối cùng cho 
biết sô chí thị trung bình của 5 ngôn ngừ. 


Phát biếu 

SAL 

XPL 

Portran 

c 

1 - 

Pascal 

Trung bình 

Gán 

47 

55 

51 

38 

45 

47 

If 

17 

17 

10 

43 

29 ■ 

23 

Call 

25 

17 

5 

12 

15 

15 

Loop 

6 

5 

9 

3 

5 

6 

Goto 

0 

1 

9 

3 

0 

3 

Khác 

5 

5 

16 

1 

6 

7 


Hình 8.1 Các nghiên cứu về 5 ngôn ngữ lập trình cho biết tỉ lệ phần trăm 
cúa mỗi loại phát biếu trong các mầu chương trình được đánh giá. Cột cho 
biết trung bình, không phải là tống, đối với 100% được làm tròn. 

Điều hêt sức rõ ràiig là đa sô các chương trình đều có nhiều 
phát biểu gán, các phát biểu if và gọi thủ tục ( tổng cộng là 85% ). 
Thậm chí điều đáng quan tâm hơn lại là sự phân bô' sô' các phần tử 
trong phép gán, sô các biên vô hướng cục bộ và sô các tham sô' của 
mỗi phát biểu gọi thủ tục. Những điều này được trình bày trong 
hình 8.2. 

Từ các dữ liệu cứa hình 8.2 ta thấy rằng 80% các phát biểu gán 
đều có dạng variable := value, như gán một hằng số, một biến hoặc 
một phần tư dãy cho một biến. Chỉ có 15% các phát biểu gán cần có 
thêm một toán tử ở bên vế phải như trong V ;= a + b hoặc V ;= 
a - b[i]\ Nói cách khác, chỉ có 5% các biểu thức có 2 hoặc nhiều 
toán tử. 

















Chương 8: Cấu trúc máy tính nâng cao 


519 Ịg) 


Sự phân bố các biến vô hướng cục bộ cũng là điều cần quan tám. 
Gần Vi số thủ tục được đánh giá không có biến vỏ hướng nào, 80% 
có 4 biến hoặc ít hơn. Cuối cùng, có 41% các thủ tục được đánh giá 
không có tham số nào cả và chỉ có 8% có 5 tham số hoặc nhiều hơn. 


N Terms N Locals 


0 

22 

1 

17 

2 

20 

3 

14 

4 

8 

>5 

20 


0 

— 

1 

80 

2 

15 

3 

3 

4 

2 

>5 

0 


<a) (b) 


N Parameters 


0 

41 

1 

19 

2 

15 

3 

9 

4 

7 

>5 

8 


(c) 


Hình 8.2 (a) Số phần tử trong các phát biểu gán (b) sỏ biến vô hướng cục 
bộ cho mỗi thủ tục (c) Số tham số trong lời gọi thù tục. Tổng có thể khác 

100% do làm tròn 

Kết luận từ những nghiên cứu này hay nghiên cứu khác là rõ 
ràng và hơi bất ngờ. Trong lúc người theo lý thuyết có thể viết 
những chương trình râ't phức tạp, những người theo thực tế lại viết 
nhửng chương trình bao gồm các phát biểu gán đơn giản, các phát 
biểu if và các lời gọi thủ tục với ít tham số. Kết luận này có quan 
hệ mật thiết đối với khuynh hướng đưa ngày càng nhiều chức năng 
vào vi mã. 

Khi các ngôn ngừ máy ngày càng lớn hơn và phức tạp hơn, 
trình phiên dịch của chúng, các vi chương trình ngày càng lớn hơn 
và chậm hơn. Nhiều chỉ thị hơn nghĩa là phải tốn nhiều thời gian 
hơn để giải mã các opcode. Thậm chí quan trọng hơn, nhiều kiểu 
định địa chỉ nghĩa là việc phân tích địa chỉ không còn được thực 
hiện trong một dòng lệnh nữa, bởi vì một vi mã sè phái được lặp lại 
hàng trăm lần trong vi chương trình. Ta cần có các vi thủ tục và 
hầu hết chỉ thị đều phải gọi một vi thủ tục để phân tích các kiểu 
định địa chỉ. Trên một máy ( như máy VAX ) thông thường có 2 
kiểu định địa chi cho mỗi chỉ thị, vi thủ tục đánh giá địa chỉ phải 
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được gọi 2 lần, một lần cho toán hạng nguồn và một lần cho toán 
hạng đích. 

Kha năng xâu nhất là các máy phái có tốc độ chậm xuống để 
cho phép thèm tất cả loại chí thị và kiểu định địa chỉ, trong thực 
tế, hầu như không được sử dụng. Bằng cách loại bỏ trình phiên dịch 
và nếu mỗi chương trình dược biên dịch trực tiếp thành vi mã và 
được thực thi với bộ nhớ bán dẫn RAM có tốc độ nhanh, người ta 
nhận ra rằng có thể tạo rá máy tính chạy nhanh hơn nhiều. 

Việc viết các trình biên dịch đề tạo ra vi mã ngang và song 
song, như ớ máy Mic-1 ( hình 4.9 ), là cực kỳ khó, nhưng việc tạo ra 
mà cho máy Mic-2 ( hình 4.17 ) lại không khó lắm. Mỗi vi lệnh 
trong máy Mic-2 chỉ thực hiện một chức năng và hoàn thành trong 
một chu kỳ đường dữ liệu dơn ( nghĩa là ALƯ ). Việc tạo mã cho 
một máy giông như vậy không khó hơn nhiều so với việc tạo mã 
cho một máy tính mini hoặc một máy vi tính trước đây, như máy 
PDP-8 hoặc 8080. 

Tóm lại, về cơ bản máy RISC chỉ là một máy tính có rất ít vi 
lệnh dọc, không giôhg máy Mic-2. Các chương trình cùa người sử 
dụng được biên địch thành các chuỗi vi lệnh này và sau đó được 
thực hiện trực tiêp bằng phần cứng, không có trình phiên dịch xen 
vào. Kết quả là những điều đơn giản mà các chương trình thực sự 
làm, như cộng 2 thanh ghi, bây giờ có thể được thực hiện bằng một 
vi lệnh. Trái lại, trong hình 4.16 và 4.20, ta thây rằng các chỉ thị 
ngôn ngữ máy nhanh nhất ( thí dụ máy Mac-1 ) chiếm 8 tới 15 vi 
lệnh. Bằng cách đạt được một hệ số là 10 trong trường hợp tổng 
quát, ta có đủ khả năng để gánh hậu quả tai hại trong trường hợp 
bất thường, và tạo ra một độ lợi thực và lớn về hiệu suất. 

Trước khi Wilkes phát minh ra vi lập trình, tất cả máy tính đều 
là máy RISC với các chỉ thị đơn giản được thực hiện trực tiếp bằng 
phần cứng. Sau khi tìm thấy phương pháp vi lập trình, các máy 
tính đã trở nên phức tạp hơn và ít hiệu quả hơn. Ngày nay ngành 
công nghiệp máy tính đang trở lại cội nguồn của minh với việc xây 
dựng lại lần nữa những máy đơn giản, có tốc độ nhanh. 
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Bước đột phá tạo ra các máy RISC khả thi là sự cải tiến phần 
mềm, không phải sự cải tiến phần cứng. Đây là sự cải thiện trong 
việc tối ưu hóa công nghệ trình biên dịch làm cho trình này có thể 
tạo ra vi mã ít nhất cũng tốt bằng nếu như không tốt hơn vi mã 
viết bằng tay. Trước khi có bước đột phá này, điều này có ý nghĩa 
là có một người lập trình thông minh viết một vi chương trình bằng 
tay, và có vi chương trình phiên dịch các chương trình của người sử 
dụng. 

Ngày nay, có khá năng đẽ cho trình biên dịch trực tiếp tạo ra vi 
mã, loại bỏ trình phiên dịch. Trong quá khứ, không có trình phiền 
dịch nào có thể tạo ra vi mà dù tốt, mặc dù với tất cả sự cóng bằng, 
người thiết kế phần cứng cũng đã giúp dỡ : các máy RISC có hơi 
dơn giản hơn ngay cả so với các vi cấu trúc dọc. 

Máy RISC hiện đại đầu tiên là máy tính mini 801 được IBM 
xây dựng, bắt đầu vào năm 1975. Tuy nhiên, IBM dã không công bô" 
điều gì liên quan đến máy này cho đến nãm 1982 ( Radin, 1982 ). 
Vào năm 1980, một nhóm ở Berkeley đứng đầu là David Patterson 
và Carlo Séquin bắt đầu thiết kê các chip RISC dạng VLSI 
( Patterson, 1985; Patterson và Séquin, 1981, 1982 ). Họ đặt ra 
thuật ngữ RISC và đặt tên cho chip CPU của họ là RISC I, không 
lâu sau đó là RISC II. Sau đó một chút, năm 1981, bên kia vịnh San 
Francisco ở Staníord, John Hennesy đã thiêt kê và chê tạo một 
chip hơi khác chip RISC và gọi là MIPS ( Hennessy, 1984 ). 

Ba máy RISC này được so sánh với 3 máy CISC trong hình 8.3. 

Mỗi một máy đã trực tiếp dẫn đầu những sản phẩm thương mại 
quan trọng. Máy tính mini 801 là tổ tiên của IBM PC/RT, máy 
RISC I là ý tưởng hay của thiết kê SPARC của Sun Microsystem và 
chip Staníbrd MIPS dã dẫn đến sự hình thành của các hệ thông 
máy tính MIPS, tạo ra các chip CPU dùng trong các máy RISC được 
bán bởi DEC và những người cung cấp máy tính khác. 

Một sô' tham khảo khác có liên quan tới công trình của máy 
RISC là ( Birnbaum and Worley, 1986; Gimarc và Milutinovic’, 
1987; Moussouris et al., 1986; Robinson, 1987; Steenkiste and 
Hennessy, 1998; Tabak, Wallich, 1985; Wilson, 1988 ). 
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IBM 

370/168 

VAX 11/780 

Xerox 

Dorado 

IBM 

801 

Berke- 

ley 

RISC1 

Stan- 

Ford 

MIPS 

Nám 

hoàn 

thành 

1973 

1978 

1978 

^L980 

1981 

1983 

Các chi 
thị 

208 

303 

270 

120 

3 

55 

Kích 

thước vi 

mã 

54K 

61K 

17K 

0 

0 

0 

Kích 

thưức 
chi thị 

2-6 

2-57 

1-3 

4 

4 

• 

4 

Kiểu 
thực thi 

Reg-reg 

Reg-mem 

Mem-mem 

Reg-reg 

Reg-mem 

Mem-mem 

Stack 

Reg-reg 

Reg-reg 

Reg-reg 


Hình 8.3 So sánh 3 loại máy CISC tiêu biểu với 3 máy RISC đầu tiên 
Kích thước chỉ thị và vi mã được tính bằng byte 

8.2 CÁC NGUYÊN TẮC thiết kê máy RISC 

Trong phần này ta sẽ thảo luận chi tiết về thiết kế kỹ thuật của 
máy RISC. Tuy thè, trước tiên chúng ta hãy trình bày một cách 
ngắn gọn triết lý thiết kế của máy RISC cơ bản. Việc thiết kế máy 
RISC có 5 bước : 

1. Phân tích các ứng dụng để tìm ra các thao tác chính 

2. Thiêt kê đường dừ liệu tối ưu cho các thao tác chính 

3. Thiêt kê các chỉ thị thực hiện các thao tác chính bằng cách 
dùng đường dừ liệu 

4. Thêm những chỉ thị mới chỉ khi chủng không làm chậm tốc 
độ máy 

Lặp lại quá trình này cho những tài nguyên khác 


5. 
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Bước đầu tiên nói với người thiết kế rằng cần tìm ra điều mà 
chương trình thực sự dự định làm. Đôi với những ngôn ngữ giải 
thuật truyền thông, một số thông kẽ được trình bày trong hình 8.1. 
Tuy nhiên với các ứng đụng trong COBOL, Smalltalk hoặc Lisp, 
người ta sẽ phải bắt đầu tập hợp tất cả thông tin thống kê về các 
chương trình thực bằng những ngôn ngữ này. Tương tự, khi thiết kế 
các máy chuyên dụng cho nghiệp vụ điều hành ngân hàng, người 
máy học ( robotics ) hoặc những ứng dụng thiết kế được máy tính 
trợ giúp CAD, ta sẽ cần những thông tin khác nữa. 

Trọng tâm của bât kỳ máy tính nào cũng là đường dữ liệu chứa 
các thanh ghi, ALU và các bus kết nối chúng. Mạch điện này cần 
được tôi ưu hóa đối với ngôn ngữ hoặc ứng dụng đang bàn đến. Thời 
gian cần để tìm nạp các toán hạng từ các thanh ghi, đưa chúng qua 
ALU và cất kết quả trở lại vào thanh ghi được gọi là thời gian của 
chu kỳ dường dữ liệu ( data path cycle time ), thời gian này càng 
"gắn càng tốt. 

Bước kế tiếp là thiết kế các chi thị máy sao cho sứ dụng tốt 
đường dữ liệu. Tiêu biểu chỉ cần vài chỉ thị và vài kiểu định địa chỉ. 
Các chỉ thị phụ chi nên được thêm vào nếu chúng thường xuyên 
được sử dụng và không làm giảm hiệu suât của các chỉ thị quan 
trọng nhất. Qui luật Golden sô 1 cúa máy RISC phát biểu : 

Hy sinh mọi thứ để làm giảm thời gian của chu kỳ đường dữ 
liệu 

Mỗi khi có một đặc tính mới hấp dần, đặc tính này cần được 
xem xét theo quan niệm sau : dặc tính này ảnh hường như thê nào 
đến thời gian của chu kỳ đường dừ liệu ?. Nêu đặc tính này làm 
táng thời gian của chu kỳ, có lẽ không nên có. 

Cuôi cùng, quá trình gĩống như vậy nên được lặp lại với những 
tài nguyên khác trong CPU, như bộ nhớ truy nhập nhanh, quản lý 
bộ nhớ, các bộ đồng xử lý dấu chấm động và v.v... Antonie de St. 
Exupéry đã diễn tả thật thích đáng : “ Sự hoàn hảo nhận được 
không phải khi không còn gì dể thềm vào mà là khi không còn gì 
để lấy đi 
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Các máy RISC khác với các máy CISC tương ứng về 8 mặt quan 
trọng liệt kê trong hình 8.4. Bây giờ chúng ta hãy khảo sát chi tiết 
từng yếu tố này. 

Một chỉ thị ứng với một chu kỳ đường dữ liệu 

Về một ý nghĩa nào đó tên RISC là một thuật ngừ sai, thực sự 
đa số các máy RISC đều có một số chỉ thị tương đồi ít. Một đặc tính 
quan trọng nhất đê phân biệt chúng với các máy CISC là những chỉ 
thị của máy RISC được thực hiện hoàn tất trong một chu kỳ đường 
dừ liệu. 



RISC 

CISC * 

1 

Các chi thị đơn giãn chiếm 1 chu 

kỳ 

Các chỉ thị phức tạp chiếm nhiều 
chu kỳ 

2 

Chi LOADS/STORES tham chiếu 
bộ nhớ 

Bất kỳ chỉ thị nào cũng có thề 
tham chiếu bộ nhớ 

3 

Sứ dụng đường ông à mức độ cao 

Không hoặc sử dụng đường ống ở 
mức độ thấp 

4 

Các chi thị được thực thi bời phần 
cứng 

Các chỉ thị được phiên dịch bởi vi 
chương trình 

5 

Dạng các chi thị cố định 

Dạng các chỉ thị thay đổi 

6 

Chi có vài chi thị và kiểu định 
địa chi 

Có nhiều chỉ thị và kiểu định địa 
chỉ 

7 

Độ phức tạp thuộc về trình biên 
dịch 

Độ phức tạp thuộc về vi chương 
trình 

8 

Các tập nhiều thanh ghi 

Một tập thanh ghi 


Hình 8.4 Các dặc tính của máy RISC vã CISC 


Xem xét hình 4.10 hoặc 4.18 ta thấy chu kỳ đường dừ liệu bao 
gồm việc tìm nạp 2 toán hạng từ thanh ghi của vùng nhớ nháp 
( vùng nhớ bao gồm các thanh ghi trong CPU ), đặt chúng lên các 
bus nội, đưa chúng qua ALU và cuối cùng cất kết quả trở lại vào 
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vùng nhớ nháp. Toàn bộ hoạt động này chiếm một chu kỳ xung 
clock. Về phương diện này, một chi thị của máy RISC rất giống một 
vi lệnh. Trái lại, một chỉ thị dược phiên dịch, như các chì thị cùa 
máy Mac-1 được phiên dịch trong hình 4.16 và 4.20, điển hình 
chiếm 10 chu kỳ xung clock. 

Hệ quá cùa nguyên tắc mọi chi thị cúa máy RISC chí chiêm một 
chu kỳ là bât kỳ thao tác nào không thê thực hiện được trong một 
chu kỳ sẽ không thế có mặt trong tập chỉ thị. Do vậy nhiều máy 
RISC thiếu các chỉ thị nhân hoặc chia. Thực tê, hầu hết các phép 
'nhân với các hằng số nhỏ được biết ở thời gian biên dịch nên chúng 
có thế được mô phỏng bằng những chuỗi các phép dịch và cộng. Các 
phép nhân còn lại và các phép chia dược điều khiển bời các thủ tục 
thư viện. Các chỉ thị dấu châm dộng được thực thi nhờ một bộ đồng 
xử lý. 

Cấu trúc LOAD/STORE 

Với mong muốn mỗi chỉ thị chi chiêm một chu kỳ xung clock, rõ 
ràng các chỉ thị tham chiêu bộ nhớ sè có vân đề. Các chỉ thị tìm 
nạp các toán hạng từ các thanh ghi và cât kêt quá vào các thanh 
ghi có thể được điều khiến trong một chu kỳ, nhưng các chi thị tìm 
nạp từ bộ nhớ hoặc cất. vào bộ nhớ sẽ chiêm thời gian rât dài. Việc 
tăng chu kỳ xung clock với một hệ sô gâp 2 hoặc 3 để thích ứng với 
các chỉ thị nạp và cât là vi phạm qui luật Golden số 1 cua thiẽt kê 
máy RISC. 

Giải pháp đưa ra có 2 phần. Trước tiên các chi thị thông thường 
chỉ có các toán hạng thanh ghi. Như vậy, không giông như trên 
80386, 68030 và các máy CISC khác, chúng không có các kiểu định 
dịa chỉ trực tiếp, định chi số, gián tiẽp thanh ghi và gián tiêp bộ 
nhớ. Chỉ có kiểu định địa chỉ thanh ghi là được phép. 

Tuy nhiên một sô chỉ thị phải tham chiêu bộ nhớ nên các chì 
thị đặc biệt LOAD và STORE được thêm vào cấu trúc. Chỉ những 
chỉ thị này mới có thể tham chiêu bộ nhớ. Hình 8.5 trình bày một 
tập điển hình các chỉ thị LỌAD/STORE cho một máy RISC 32-bit. 
Hai chỉ thị LOAD có dấu nạp 8 hoặc 16 bit vào phần thấp cua 
thanh ghi 32-bit chuyên dụng và làm đầy các bit còn lại bằng bit 
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dấu ( bit 7 hoặc 15 ) để tạo ra một số nguyên có dâu 32-bit. Các chỉ 
thị LOAD không dấu không truyền được bit dấu. vấn đề sẽ không 
nảy sinh đôi với các chỉ thị LồAD và STORE cho một từ đầy đủ. 

Cũng nên nhấn mạnh, chỉ có những chỉ thị có khả năng định 
địa chí bộ nhớ mới được thể hiện trong hình 8.5. Dạng chỉ thị dùng 
cho ADD, MOVE, AND và v.v... chứa các trường toán hạng 5-bit để 
định địa chỉ cho 32 thanh ghi, nhưng không có trường nào cho các 
địa chi bộ nhớ. 


Nạp byte có dấu 

Cất byte 

Nạp byte không dấu 

Cất byte 

Nạp V 2 từ có dấu 

Cất Vố từ 

Nạp l /2 từ không dấu 

Cất Vố từ 

Nạp từ 

Cất từ 


Hình 8.5 Các chi thị LOAD và STORE cho một máy RISC 32-bit 

Sử dụng đường ổng 

Dĩ nhiên việc cấm các chí thị thóng thường truy xuất bộ nhớ 
không giải quyết được vấn đề làm thế nào để các chỉ thị LOAD và 
STORE hoạt động trong một chu kỳ. Giái pháp đưa ra liên quan 
một chút đến một kỹ thuật đặc biệt. Chúng ta sẽ nới lỏng mục tiêu 
của chúng ta. Thay vì yêu cầu thực hiện mọi chí thị trong một chu 
kỳ, ta chi đơn thuần nhấn mạnh rằng có thể bắt đầu một chỉ thị ở 
từng chu kỳ, không quan tâm đến khi nào chỉ thị kết thúc. Nếu 
trong n chu kỳ ta xoay xở để bắt đầu n chỉ thị, tính trung bình ta 
đã đạt được một chi thị cho mỗi chu kỳ, như vậy là tốt. 

Để đạt được mục tiêu đă thay dổi này, tất cả máy RISC đều sử 
dụng kỹ thuật đường ống ( pipeline ) trong xử lý chỉ thị. Ta đã 
nghiên cứu kỹ thuật đường ống trong phần 4.5.4 nên ở đây chỉ lặp 
lại ý tưởng cơ bản. CPU chứa vài đơn vị độc lập làm việc song song. 
Một đơn vị trong số đó tìm nạp các chỉ thị, các dơn vị khác giải mã 
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và thực thi chúng. Bất cứ lúc nào cũng có vài chỉ thị đang à trong 
các tầng xử lý khác nhau. 

Hình 8.6 trình bày một đường ông có 3 tầng đê tìm nạp các chi 
thị, thưc thi các chỉ thị và thực hiện các tham chiếu bộ nhớ. Các chỉ 
thị thông thường trong máy có 2 chu kỳ đê tìm nạp và thực hiện. 
Các chỉ thị LOAD và STORE cần thêm chu kỳ thứ 3 để tham chiếu 
bộ nhớ. Trong chu kỳ 1, chỉ thị 1 dược tìm nạp. Trong chu kỳ 2, chỉ 
thị 2 được tìm nạp và chì thị 1 được thực hiện. Trong chu kỳ 3, chỉ 
thị 3 ( đánh dấu là L cho LOAD ) được tìm nạp và chỉ thị 2 được 
thực hiện. Trong chu kỳ 4, chỉ thị LOAD được bắt đầu nhưng không 
thể hoàn tất được trong một chu kỳ. 


Cycle 

123456789 10 


Instruction fetch 

1 

2 

L 

4 

5 

6 

s 

8 

9 

10 

Instruction execution 


1 

2 

L 

© 

5 

6 

s 

© 

9 

Memory reference 





L 




s 



Hình 8.6 Máy RISC dùng phương pháp dường ống có LOAD, L và STORE, 

s trì hoãn 

Instruction fetch : tìm nạp chí thị 
Instruetion execution : thực thi chi thị 
Memory reíerence : tham chiếu bộ nhớ 

Trong chu kỳ 5 có điều dáng chú ý xảy ra ( đánh dâu bằng vòng 
tròn ). Chỉ thị 4 được thực hiện mặc dù chỉ thị LOAD đã bắt đầu ở 
chu kỳ trước và chưa hoàn tất. Miền là chi thị 4 không sử dụng 
thanh ghi trong quá trình được LOAD, mọi thứ đều tôt đẹp và máy 
tiếp tục thực thi ở tốc độ đúng. Trình biên dịch có nhiệm vụ báo 
đảm rằng chỉ thị theo sau LOAD không sử dụng phần tử đang được 
tìm nạp từ bộ nhớ. Nếu trình biên dịch không thể tìm thấy bất kỳ 
chĩ thị nào theo sau LOAD, trình này luôn luôn chèn chỉ thị NO-OP 
và bỏ phí một chu kỳ. Tình huống tương tự sau khi STORE ( xem 
chu kỳ 9 ) không gây ra một vấn đề nào trừ phi chỉ thị 8 không 
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Khái niệm có một chỉ thị LOAD không tạo hiệu quả tức thời 
được gọi là nạp bị trì hoãn ( delayed load ). Trong thí dụ, kết quả 
không thê dùng được trong 1 chu kỳ, nhưng các trì hoãn lâu hơn 
cũng có thế xảy ra tùy thuộc vào tỉ lệ giữa tốc độ bộ xử lý với tốc độ 
bộ nhớ. Với một sô máy RISC trình biên dịch có nhiệm vụ làm đầy 
những khe theo sau các chỉ thị LOAD bằng cái gì đó có ích. Các 
máy MIPS sứ dụng phương pháp hơi khác, ơ đây trình biên dịch 
tạo ra mã tuần tự và một chương trình gọi là trình tổ chức lại 
( reorganizer ) thay đối lại các chỉ thị hợp ngữ, làm đầy các khe ở 
sau các chi thị LOAD. Phương pháp này không chi giữ cho trình 
biên dịch dơn giản hơn mà còn cho phép sử dụng cùng một trình tổ 
chức lại với tất cả các trình biên dịch sao cho vấn đề chi phải xử lý 
một lần. 

Theo một ý nghĩa nào đó, trước kia ta đã gặp khái niệm về nạp 
bị trì hoãn. Trong máy Mic-2 { hình 4.17 ), vi lệnh BEGRD khởi 
động một thao tác bộ nhớ, kết quả của thao tác không sử dụng được 
trong 2 chu kỳ. Trong máy Mic-2, khe theo sau BEGRD phải được 
làm dầy bàng CONRD, thực chât là một NO-OP. Ta có thê dễ dàng 
thay đổi thiết kế đế cho phép các chỉ thị khác theo sau BEGRD với 
điều kiện các chì thị này không tham chiếu tới thanh ghi trong quá 
trình nạp. 

Điều gì sẽ xảy ra nếu một chương trình muốn sử dụng thanh 
ghi mới nạp trước khi việc nạp hoàn tất ? Các máy RISC khác với 
các máy khác ở điểm này. Đa số máy RISC đều có một khóa liên 
động ( tránh cho 2 bộ phận cùng hoạt động ) phần cứng í hardvvare 
interlock ) có tác dụng tự động chèn thêm các NO-OP cho tới khi 
thanh ghi đã được nạp xong. 

Mặt khác cũng có các máy RISC, như MIPS, đơn giản chỉ dùng 
giá trị không đúng trong thanh ghi. Nếu trình tổ chức lại không thể 
làm đầy khe, trình phải chèn thêm một NO-OP cụ thể, làm tăng 
chiều dài của chương trình. Thuận lợi của phương pháp này là có 
một CPU đơn gián hơn ( và có khả năng nhanh hơn ), vì phần cứng 
không phải kiểm tra xem thanh ghi hiện đang được truy xuất có giá, 
trị hay không. 
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Các chỉ thị LOAD và STORE không phải là nhừng chi thị duy 
nhất bị trì hoãn. Như dã gặp trong phần 4.5.4, các chỉ thị nhảy có 
điều kiện làm phá hỏng phương thức làm việc của các máy có sử 
dụng đường ống. Giải pháp của máy RISC cho vấn đề này cũng 
giông như giải pháp cho các chỉ thị LOAD và STORE, gọi là nhảy 
bị trì hoãn ( delayed jump ). Chỉ thị theo sau chỉ thị JƯMP luôn 
luôn dược thực thi, chỉ thị JUMP sau cùng có được lây ra hay không 
là điều không quan trọng. Tất cả giải thuật dự đoán phức tạp đã 
thảo luận trong chương 4 không còn cần đến nữa. Trong máy RISC, 
không có thời gian để chạy những giải thuật đó. Trinh biên dịch 
hoặc trình tổ chức lại có nhiệm vụ phải tìm ra chí thị hữu ích đế 
đưa vào sau mỗi chi thị JUMP. Nêu thât bại, sử dụng chỉ thị NO- 
OP. 

Không có vi mã 

Các chí thị được tạo ra bởi một trình biên dịch cho một máy 
RISC được thực thi trực tiếp bằng phần cứng, chúng không được 
phiên dịch bới vi mã. Việc loại bỏ cảp phiên dịch này là một bí mật 
về tốc dộ của máy RISC. 

Cách các chi thị được thực thi không khó nếu ta xem lại hình 
4.18 lần nửa. Thay vì đèn từ bộ nhớ diều khiến 256 X 12 như trình 
bày trong hình vẽ, “ các vi lệnh ” đèn từ ngõ ra cứa dơn vị tìm 
nạp chỉ thị của đường ống , nghĩa là, từ bộ nhớ chính. Chúng không 
phải là những vi lệnh mà là các chỉ thị cúa chương trình người sứ 
dụng. 

Tuy nhiên, về cơ bản việc thực thi chúng cũng giống như ở hình 
4.18. Đơn vị giái mã OP bao gồm mạch logic nối dây cứng ( hard- 
wired logic ) ( hoặc một PLA ) lảy trường opcode làm dữ liệu vào và 
tạo ra tất cả tín hiệu điều khiên cần thiẽt dể điều khiến đường dữ 
liệu. Miễn là đơn vị tìm nạp chỉ thị có khả năng cung cấp một chi 
thị cho mỗi chư kỳ, một thao tác của đường dữ liệu có thể được thực 
hiện trên từng chu kỳ. 

Những người ủng hộ máy CISC thường cho rằng việc thực thi 
các chỉ thị phức tạp bằng vi mã sẽ tốt hơn so với mã của người sử 
dụng. Phát biểu này dẩn chúng ta tới qui luật số 2 cúa máy RISC : 
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Vi mã không phải là phép thuật 

Nếu một chi thị phức tạp ( chẳng hạn cộng số thập phân ) 
chiếm 10 vi lệnh với mỗi vi lệnh là 100 nsec ta sẽ mất 1 psec để 
thực thi chi thị này trên một máy CISC. Trên máy RISC, chỉ thị 
tương tự sẽ chiếm 10 chi thị RISC thay vì 10 vi lệnh. Nêu các chỉ 
thị của RISC cũng mất 100 nsec, chỉ thị dó sẽ mât 1 psec. 

Thuận lợi duy nhát đỏi với việc hiện thực máy CISC là tiết 
kiệm được một ít bộ nhớ. Tuy nhiên nếu thao tác xảy ra tương đối 
thường xuyên, thao tác có thê được tạo thành một thú tục thư viện 
với một chi phí nhò cho tốc độ. Đa sô các chương trình đều thực 
hiện những điều đơn gián, vì thế cũng xứng đáng đế chấp nhận một 
bất lợi nhò trên các chi thi không thường dùng để đổi lại việc di 
chuyến thanh ghi và các phép cộng đơn giản nhanh hơn. 

Các chỉ thị dạng cô" định 

Nhu cầu đôi với các chỉ thị có dạng cố định ( fixed format 
instruction ) là rõ ràng như ờ hình vẽ 4.18. Các bit riêng rè trong 
mỗi chi thị được dùng như dừ liệu vào cho đơn vị giải mã OP và 
những phần khác cũa phần cứng. Các chỉ thị có chiều dài thay đổi 
( variable length instruction ), thí dụ trong tầm từ 1 tới 17 byte như 
trên 80386, sẽ không thực hiện được ơ dây. Các chỉ thị thay đổi chỉ 
làm việc khi có một vi chương trình bên trong, lấy tuần tự các byte 
từ hàng đợi tìm nạp chỉ thị ( instruction fetch queue ) và phân tích 
chúng tuần tự bằng phần mềm. 

Tập chỉ thị thu gọn 

Cuối cùng, chúng ta cũng đi đến vấn đề được dùng để đặt tên 
cho máy RISC. Thực ra, không có sự phản đôi nào không vượt qua 
được đối với việc có nhiều chi thị, miền là mỗi chỉ thị chí thực thi 
trong một chu kỳ. Vấn đề thực tế duy nhất là sự phức tạp của đơn 
vị giải mã OP sẽ tăng lũy thừa theo số chỉ thị và như vậy sẽ tiêu 
thụ càng nhiều vùng chip khan hiếm. 

Tình huôứig với các kiểu định địa chỉ thì khác. Vì các lý do về 
tốc độ và độ phức tạp, người ta không muốn có nhiều hơn một số 
tôi thiểu các kiểu định dịa chỉ. Hình 8.7 trình bày một dạng chỉjhị 
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cơ bản dùng trong máy RISC I. Chỉ thị chỉ có một opcode, 2 thanh 
ghi 5-bit, một bit kiểu ( tức thời hoặc không tức thời ) và một offset, 
Bằng cách sử dụng một dạng chỉ thị và thực tế thanh ghi 0 được 
nối cứng với hằng số 0, ta có thể tạo ra hầu hẽt các kiểu định địa 
chỉ có'ích. 


Bíts 7 


13 


OPCOOE 


c DEST 


SOURCE 


OFFSET 


N 


0 = Not immediate 
1 = Immediate 


0 =Do not set condition codes 
. 1 — Set condition codes 


Hình 8.7 Dạng chi thị cơ bản của máy RISC L 

0 = not immediate : 0 = không có kiểu tức thời 
1 = immediate : 1 = có kiểu Lức thời 

0 = Do not set condition codes : 0 = không thiết lập các mã điều kiện 
1 = Set condition codes : 1 = thiết lập các mà điều kiện 

Đối với các chỉ thị thông thường như chỉ thị ADD, các toán 
hạng tùy thuộc vào bit I. Nếu bit này bị xóa, một toán hạng được 
lấy từ thanh ghi nguồn, toán hạng thứ 2 được lấy từ thanh ghi xác 
định bởi 5 bit thấp của trường OFFSET và kết quá được cất trong 
thanh ghi đích. Sự kết hợp này cho ta kiêu định địa chỉ thanh ghi. 
Nếu bit I được thiết lập bằng 1, toán hạng thứ 2 là một hằng số 13“ 
bit cho ta kiểu định địa chỉ tức thời. 

Đôi với chỉ thị LOAD và STORE, trường OFFSET dược cộng với 
thanh ghi nguồn để tạo thành địa chỉ bộ nhớ hiệu dụng { định địa 
chỉ chỉ số ). Nếu OFFSET bằng 0 ta có kiêu định địa chỉ gián tiếp 
thanh ghi. Nếu thanh ghi 0 được xác định ta có định địa chi trực 
tiếp 8K dưới đáy của bộ nhớ, điều này có ích cho việc truy xuất các 
biến toàn cục. Các kiểu khác có thể được xây dựng ớ thời gian chạy 
bằng cách xây dựng một địa chỉ trong thanh ghi và sau đó dùng 
kiểu định địa chỉ gián tiếp thanh ghi hoặc định chỉ số. Thiết kế của 
máy RISC lĩ có thêm chỉ thị JƯMP có điều kiện có liên quan đến 
máy PC bằng cách ghép 3 trường thấp thành một offset có dấu 
19-bit ( trường DEST xác định điều kiện ). 
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Đưa sự phức tạp vào trình biên dịch 

Đến đây ta cần làm rỏ một nổ lực lớn đả được thực hiện để giừ 
cho phần cứng đơn giản như có thể, ngay cả phải trả giá cho việc 
tạo ra trình biên dịch phức tạp hơn nhiều. Chiến lược này tương 
phán rõ rệt với các máy như 80386 và 68030, với các kiểu định địa 
chi rất phức tạp của chúng ( xem hình 5.36 và 5.39 ) được cho là 
được phát minh dể’ giảm sự khác biệt về ngữ nghĩa như dã thảo 
luận trước đây. Trong thực tế, sự tồn tại của một sô" trong nhiều 
kiêu định địa chỉ kỳ lạ trên 80386 và 68030 làm cho cả trình biên 
dịch và vi chương trình trở nên rất phức tạp. 

Mặc dù vậy, các máy CISC vẫn không có những đặc trưng khó 
chịu như nạp bị trì hoãn, cất bị trì hoãn và nhảy bị trì hoãn. Những 
đặc trưng này làm tăng thêm đáng kế độ phức tạp cùa trình biên 
dịch hoặc trình tổ chức lại. Ngoài ra, các chỉ thị thông thường 
không thế sứ dụng các toán hạng bộ nhớ thực ra có nghĩa là với các 
trình bièn dịch của máy RISC, nhất thiết đi đến các chiều dài lớn 
đe tỏi ưu hóa việc sử dụng thanh ghi. 

Bất lợi đõ"i với việc sứ dụng tối ưu phụ sẽ rất lớn so với các 
trình biên dịch cùa máy CISC, diều này làm cho người viết trình 
biên dịch thêm gánh nặng. 

Cuôì cùng, bản thân tập chỉ thị thu gọn cũng gây ra phiền phức. 
Một sô chí thị cáp cho người viết trình biên dịch máy RISC, thí dụ 
MƯLTIPLY, phái được đồng bộ bằng nhiều cách khác nhau, tùy 
thuộc vào các toán hạng. 

Tập nhiều thanh ghi 

Nêu không có một vi lệnh nào, một sô vùng chip đáng kể trên 
các chip RISC được dành cho những mục đích khác. Một số, nhưng 
không phái tất cả, các máy RISC sử dụng vùng chip này để hiện 
thực một lượng lớn thanh ghi cho CPU nhằm giảm các chỉ thị 
LOAD và STORE. Vân dề tổ' chức những thanh ghi này như thế nào 
rất quan trọng nên chúng ta sẽ dành toàn bộ phần kế tiếp cho vấn 
đề các thanh ghi. 
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Các vấn đề mở 

Các nhà thiết kế máy RISC không đồng ý về mọi thứ Một sô' 
vấn dề thiết kế tuyệt nhiên không được giải quyết. Một vấn đề 
chính là người viết trình biên dịch có thể nhìn thấy bao nhiêu phần 
cứng. Vấn đề về các khóa liên động theo sau chỉ thị LOAD như đã 
thảo luận trước đây là một vấn đề tiêu biểu. Một phe cho rằng máy 
không thể thực hiện chỉ thị LOAD chỉ trong một chu kỳ, vì thế 
người viết trình biên dịch phải biết đặc tính này và học cách thích 
ứng. Một phe khác cho rằng dặc tính này phài được che dâu bằng 
cách khóa liên động tự động. 

Nếu việc khóa liên động thấy được, còn bộ nhớ cache ( bộ nhớ 
truy nhập nhanh ) thì sao ? Người viết trình biên dịch có thể giả 
định rằng một biến vừa sử dụng sẽ còn ở trong bộ nhớ cache, và 
như vậy có được truy xuất nhanh hơn một biên trong bộ nhớ 
không ? Người viết trình biên dịch có thể bỏ qua khe trì hoãn theo 
sau chỉ thị LOAD và sử dụng thanh ghi vừa mới nạp đúng ngay chỉ 
thị kế tiếp không hoặc điều này có giống như trò chơi Roullette của 
Nga không ? 

Trật tự của byte ( little endian và big endian ) vẫn là đề tài sôi 
nổi. Chip MIPS đã giải quyết khéo léo vấn đề bằng cách cấu hình 
theo cả hai cách. Đây có phải là ý tưởng tôt không? Rõ ràng là phải 
tốn một sô phần cứng và một sô vùng chip mà vùng chip này có thể 
dùng vào những việc khác. 

Máy RISC I có một bit trong mỗi chi thị cho biết các mã điều 
kiện có dược thiết lập hay không. Trong khi việc thiết lập các mâ 
điều kiện thường có ích trên các chỉ thị sô học, lại không có sự nhât 
trí về việc thiết lập mã điều kiện cho các chỉ thị MOVE. 

Việc thêm vào 1 bit cho người viêt trình biên dịch sự chọn lựa 
trên mọi chỉ thị MOVE. Mặt khác, chip MIPS không có một mã 
điều kiện nào. Chip này có thể kiểm tra và nhảy trong một chỉ thị. 
Phương pháp nào tốt hơn là một vấn đề được tranh luận sôi nổi và 
còn nhiều vấn đề về thiết kế khác chưa được giải quyết. 




534 


Cấu trúc Máy tính 


52 


8.3 SỬ DỤNG THANH GHI 

Mục tiêu của mọi máy RISC là trung bình thực hiện mỗi chỉ thị 
trong một chu kỳ. Vì các chỉ thị LOAD và STORE tiêu biểu cần 2 
chu kỳ, mức trung bình này chỉ có thể đạt được nếu trình biên dịch 
hoặc trình tổ chức lại thành công trong việc làm đầy 100% các khe 
trì hoãn sau mỗi chỉ thị này ( chưa kể đến các khe trì hoãn theo sau 
các chỉ thị JUMP ). Hiển nhiên càng có ít chỉ thị LOAD và STORE 
sẽ càng ít bị lãng phí do trình biên dịch thiếu khả năng làm đầy 
các khe bằng điều gì dó có ích. 

Vì lý do này, các trình biên dịch cho các máy RISC sử dụng rất 
nhiều thanh ghi để làm giảm lưu lượng truy cập bộ nhớ ( nghĩa là 
giảm sô' chỉ thị LOAI) và STORE ). Không phải chỉ có việc thực 
hiện các máy RISC có rất nhiều thanh ghi hơn các máy như 80386 
và 68030 ( 500 thanh ghi không phải là không bình thường ), mà 
quan trọng hơn là chúng được tổ chức theo một cách khác. Việc xây 
dựng một máy như PDP-11 hoặc 68030 nhưng vđi 512 thanh ghi 
thay vì 8 hoặc 16 sẽ là điều phản tác dụng. Không chỉ tất cả các chỉ 
thị 16-bit sẽ trở thành 32 bit để thích ứng với các trường thanh ghi 
9-bit, mà thời gian để cất tất cả thanh ghi khi có chỉ thị gọi thủ 
tục cũng sẽ trở thành rất tốn kém. 

Trong phần 8.2, ta đã thảo luận nhiều nguyên tắc thiết kế cho 
máy RISC, nguyên tắc đầu tiên là phân tích các ứng dụng xem 
chúng sử dụng thời gian như thế nào. Người ta đã thực hiện việc 
này một cách chính xác đối với lưu lượng truy cập bộ nhớ. Kết luận 
quan trọng nhât là một tỉ lệ lớn của toàn lưu lượng truy cập bộ nhứ 
liên quan tới các chỉ thị gọi thủ tục. Các tham sô phải được truyền, 
các thanh ghi phải được cất và địa chỉ trở về phải được cất vào 
stack khi có chỉ thị gọi thủ tục và chúng phải được lấy ra khi có chỉ 
thị trơ vê. Tât cả nhừng động tác này tạo ra lưu lượng truy cập bộ 
nhớ. 

Các nhà thiết kế máy RISC I ( Patterson and Séquin, 1982 ) 
nghĩ ra một phương pháp khéo léo loại trừ gần như tất cả lưu lượng 
này. Phương pháp của họ, bây giờ gọi là trùng lắp các cửa so thanh 
ghi ( overlapping register windows ), củng được các máy RISC khác 
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chấp nhận. Chúng ta sẽ mô tả phương pháp này ở dạng tổng quát 
dưới đây. Các chi tiêt chính xác có hơi thay đổi giữa các phương 
pháp hiện thực. 

Khi sử dụng phương pháp trùng lắp các cửa sổ thanh ghi, CPU 
chứa rất nhiều thanh ghi, nhưng trong bất kỳ lúc nào cũng chỉ có 
một tập con trong sô' đó, thường là 32 thanh ghi, được nhìn thấy. 32 
thanh ghi này được trình bày trong hình 8.8, trong đó chúng được 
đặt tên từ RO tới R31. Trên hầu hết các máy RISC, các thanh ghi 
đều dài 32 bit nhưng cũng có thể dài 64 bit hoặc có những độ dài 
khác. 

Các thanh ghi được chia thành 4 nhóm phân biệt, như minh họa 
trong hình 8.8. Trong máy RISC I, các nhóm này có 10, 6, 10 và 6 
thanh ghi. Tuy nhiên, nhiều thiết kế gần đây đã tạo ra các nhóm có 
cùng kích thước ( 8 thanh ghi mỗi nhóm ). Để đơn giản, trong thảo 
luận chúng ta sẽ đưa ra giả định thứ 2 này. 



Hình 8.8 Các thanh ghi 32-bit thây được ở 1 thời điểm đô'i với chương 

trình 


Global variables : các biến toàn cục 
Incomimg parameters : các tham số đến 
Local variables : các biến cục bộ 
Outcoming parameters : các tham số đi 

Nhóm thanh ghi thứ nhâ't lưu giữ các biến toàn cục và các con 
trỏ. Chúng không chỉ trỏ tới bất kỳ thủ tục nào mà còn được nhiều 
thủ tục sử dụng thông qua chương trình. Trình biên dịch có nhiệm 
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vụ phải quyết định đặt cái gì vào mỗi thanh ghi. Trong một sô' máy 
RISC, thanh ghi RO được nôi cứng với hằng sô 0. Đọc từ thanh ghi 
RO kết quả sẽ là 0 và thanh ghi này không bị ảnh hưởng khi ghi. 

Nhóm thanh ghi thứ 2, R8 tới R15, lưu giữ các tham sô' đến. 
Hầu hết các thủ tục đều có tham sô' cung cấp bởi thủ tục gọi. Trong 
các máy tính truyền thông, các tham sô' được cất vào stack kế tiếp 
nhau, mỗi lần một tham sô', ngay trước lệnh CALL. Khi sử dụng 
phương pháp trùng lắp các cửa sổ thanh ghi, các tham sô' của thủ 
tục được đặt vào thanh ghi R8, R9»và tiếp tục cho tới R15 thay vì 
được cất vào stack. Việc không đặt các tham sô' vào stack loại trừ 
được các STORE khi chúng dang được truyền và loại trừ các LOAD 
khi chúng được truy xuất bởi thủ tục được gọi. Nếu có nhiều hơn 8 
tham sô hoặc nếu tham sô' có nhiều hơn một từ, những tham sô' này 
không được truyền vào thanh ghi mà được truyền vào stack theo 
cách thông thường. Tuy nhiên, từ hình 8.2 (c) và các phép đo tương 
tự, ta thấy đối với đa sô' thủ tục, 8 tham sô' hình như là quá nhiều. 

Các thanh ghi từ R16 tới R23 dùng cho các biến cục bộ. Từ hình 
8.2(b) và những phép đo khác, rõ ràng trong đa sô' trường hợp, 8 
thanh ghi là đủ. Với các thủ tục cần nhiều hơn 8 từ cho các biến cục 
bộ, những từ vượt quá được cất vào stack giống như các tham số 
vượt quá của thủ tục. Tuy nhiên, nêu 80 hoặc 90% các thủ tục vẫn 
không cần dùng một stack nào, hoặc đối với việc truy xuất các tham 
sô' của chúng hoặc đối với các biến cục bộ của chúng, ta đã làm 
giảm sút đáng kể lưu lượng truy cập bộ nhở và như vậy làm giảm 
được rất nhiều chỉ thị LOAD và STORE, do đó không cần làm đầy 
các khe trì hoăn, 

Nhóm thanh ghi cuối cùng, R24 tới R31, dược dùng để truyền 
các tham số xuất cho các thủ tục được gọi. Thay vì cất các tham số 
này vào stáck, chúng được đặt ở đây. Như thường lệ, nếu đã dùng 
hết thanh ghi, các tham số vượt quá được đưa vào stack. 

Sơ đồ này là một sơ đồ linh hoạt nhưng không phải là sơ đồ rất 
đáng chú ý. Khả năng thực sự có được nhờ vào sự hiện diện của 
một bộ nhớ trên chip dung lượng lớn dưới dạng một tập thanh ghi, 
chẳng hạn 520 thanh ghi trong thí dụ này. Trong hình 8.9(a) ta tái 
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tạo lại tình huống của hình 8.8 có thêm một biến con trỏ cửa sô 
hiện hành CWP ( current window pointer ) trỏ tới thanh ghi R8. 
Khi thủ tục hiện hành A gọi một thủ tục khác B, con trỏ CWP được 
tăng 16 dể trỏ tới 24. Khi thủ tục B khởi động, tình huống được 
trình bày trong hình 8.9(b). Tham chiếu tới RO - R7 vẫn dùng 8 
thanh ghi toàn cục như trước kia, nhưng R8 - R32 bây giờ liên quan 
tới một tập 24 thanh ghi khác. Trong thực tế, R8 ( tham số đến thứ 
nhất của B ) bây giờ chứa tham sô đi thứ nhất của A. Vậy thì A có 
thể truyền các tham số tới B mà không dùng bộ nhớ và B có thế 
truy xuất chúng cũng không dùng bộ nhớ. Lý do để A và B có thể 
truyền thông theo cách này là có sự trùng lắp của 8 thanh ghi, như 
dược trình bày. Khi B gọi c, CWP được tăng lần nữa và tồn tại tình 
huống tương đối giống như vậy. 
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Hình 8.9 Trùng lắp các cửa sổ thanh ghi 

Thực ra tập thanh ghi được dùng như một loại stack, với CWP 
là con trỏ stack. Mỗi khi một chỉ thị máy tham chiếu RO tới R7, các 
thanh ghi toàn cục được sử dụng, nhưng R8 luôn luôn có nghĩa là 
thanh ghi được trỏ tới bởi CWP. Ch! có 24 thanh ghi bắt đầu ở 
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CWP ( cộng với 8 thanh ghi toàn cục ) là có thể truy xuâ't được vào 
bất cứ lúc nào. CWP được tăng theo các lời gọi thủ tục và được trả 
lại theo các chỉ thị trở về, chúng không dược sử dụng bởi các 
chương trình thông thường của người sử dụng. ( hệ điều hành có thể 
cất và khôi phục lại chúng khi chuyển các quá trình ). 

Đế sơ đồ hình 8.9 làm việc được, trình biên dịch phải tuân theọ 
những quy ước nào đó, những quy ước này không khó hiểu. Khi 
truyền các tham sô" cho thủ tục được gọi, thủ tục gọi phải đặt tham 
sô thứ nhât vào thanh ghi R24, tham sô thứ 2 vào R25 và v.v..., với 
tham sô thứ 7 vào R30 và tham sô" thứ 8, nếu có, là tham sô thứ 
nhât trên stack của bộ nhớ thực. R31 được dành riêng cho địa chỉ 
trờ về. Tương tự, khi thủ tục được gọi truy xuất các tham số, thủ tục 
này phái sử dụng R8 đế truy xuất tham sô" thứ 1, R9 truy xuâ't tham 
sô' thứ 2 và v.v.... với tham sô thứ 7 lấy từ R14 và tham sô" thứ 8, 
nếu có, lấy từ stack của bộ nhớ thực. Địa chỉ trở về có thể tìm thây 
trong R15. Miễn là tất cả thủ tục gọi và thủ tục được gọi đều tuân 
theo các quy luật đó, không có sự nhầm lẫn nào và sơ đồ làm việc 
tốt. 

Khi tham sô dài hơn một từ, trình biên dịch có nhiệm vụ điều 
khiển tham số này, nhưng có một giải pháp điển hình đặt chính 
tham sô đó vào stack cúa bộ nhớ và truyền con trò tới đó, trong 
thanh ghi thích hợp. Đối với các tham số dài tiếp sau tham số thứ 
7, không cần truyền con trỏ trong bộ nhớ tới tham số trong bộ 
nhớ ( ngay cả tham số 1-từ ); chỉ cần truyền chính tham số đó. 

Nếu chương trình được lồng vào nhau khá nhiều do các chỉ thị 
gọi thủ tục ( thí dụ do gọi đệ qui ), toàn bộ tập thanh ghi cuối cùng 
sẽ đầy. Nếu có thêm một chỉ thị gọi nữa, ta sè không còn chỗ. Giải 
pháp thông thường là thiết kế phần cứng để thúc đẩy con trỏ CWP 
gây ra một bầy. Lúc đó bộ điều khiển bẫy cất cửa sổ thanh ghi thứ 
1 bắt đầu ở R8 trong hình 8.9(a), bằng cách chép vào bộ nhớ. Nếu 
tiêp tục có chỉ thị gọi, một bẫy khác xảy ra trên chỉ thị gọi và 
nhiều thanh ghi nữa được cất vào bộ nhớ. Theo cách này, tập thanh 
ghi được dùng như một loại bộ đệm vòng tròn. Cần có sự quản lý để 
theo dõi cái gì ở trong các thanh ghi và cái gì ở trong bộ nhớ, điều 
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này không khó thực hiện. Trong thực tế, các chương trình gọi đệ 
qui nhiều làm tràn tập thanh ghi lại tương đối hiếm. 

Rõ ràng cho tới bây giờ, sự trùng lắp các cửa sổ thanh ghi làm 
giảm được nhiều tham chiếu bộ nhớ đôi với các tham sô và địa chỉ 
trở về. Và rõ ràng sơ đồ này cũng ít phải thực hiện với các máy 
RISC và có thể cũng thực hiện tốt trên chip CISC. Tuy nhiên, 
nguyên nhân.sơ đồ được phát minh trong bôi cánh cua máy RISC là 
một tập thanh ghi lớn như vậy sẽ chiếm một vùng lớn đáng kế trên 
chip CPU. Trẽn chip CPU qui ước, chip có quá nhiều vi mã nên 
không có đú chỗ cho nhiều thanh ghi. Chi có cách duy nhất là loại 
bỏ vi mã để dành vùng chip trông cho tập thanh ghi lớn. 

Tuy nhiên, có lần chúng ta đã loại bỏ vi mả nhưng một tập 
thanh ghi lớn không phải là ứng viên duy nhất đối với vùng chip 
trống này. Một khả năng khác là dùng bộ nhớ cache. Cache có 
thuận lợi không chi lưu giữ dữ liệu mà còn chứa những chỉ thị đả sử 
dụng gần đây. Hơn nữa, cache không bắt buộc một sự phân chia 
cứng nhắc với một số cô định biến toàn cục, một sô cố định tham sô 
và một sô cô định biến cục bộ như ở sơ đồ cứa sổ thanh ghi. Bàng 
cách thích ứng động với mô hình sử dụng thực tẽ, khả năng sừ 
dụng sẽ hiệu quả hơn. 

Thực tế, cách làm việc đôi lập với cache là mọi điểm nhập cùa 
cache đều có 3 trường gồm trường bit hợp lệ, trường tag và trường 
dữ liệu { xem hình 4.29 ). Hai trường dầu chiếm vùng chip nhưng 
không dược dùng đế chứa dữ liệu. Chúng là một dạng chi phí tiêu 
hao và làm giảm hiệu suất sử dụng chip. 

Cho biết CWP và số cua thanh ghi ( RO tới R31 ), phần cứng dễ 
dàng tìm ra thanh ghi thích hợp bằng một phép tính đơn giàn, 
nhưng bằng cách dùng cache, địa chỉ bộ nhớ đầy đủ phải được tính 
toán và di chuyền ( thay vì chí là một sô cùa thanh ghi ), và một 
phần của địa chỉ phải được lấy ra và so sánh với một hoặc nhiều 
tag tùy thuộc vào cách tổ chức cache. Mạch điện dùng cho những so 
sánh này cũng sử dụng vùng chip và chính những so sánh đó cũng 
làm tốn thời gian. Nhìn chung, các phẩm chất tương đối của các tập 
thanh ghi so với cache trên chip vần đang được nghiên cứu. 
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Sự phân phôi thanh ghi 

Cấu trúc trùng lắp cửa sổ thanh ghi đã trình bày ở trên làm 
việc tốt nhất khi tất cả, hoặc gần như tất cả, các biến cục bộ ở 
trong các thanh ghi. Đối với những thủ tục nhỏ, thường không có 
vấn đề gì, nhưng đôi với nhừng thủ tục lớn hơn có thể có nhiều biên 
hơn sỏ' thanh ghi. Trong trường hợp này một sô' biến phải được đô 
vào bộ nhớ, như đã mô tá ớ trên. 

Đê giám thiếu tôi đa vân đề này, đồng thời phù hợp với triêt lý 
thiết kế máy RISC là cất nhiều công việc như có thể lên trình biên 
dịch, đa số các trình biên dịch của máy RISC đã có cố gắng lớn để 
tôi ưu hóa việc sứ dụng thanh ghi nhằm làm giảm sô biên phải 
được cất trong bộ nhớ. Phương pháp thông thường là dùng chung 
các thanh ghi riêng rẽ trên nhiều biến, được sứ dụng trong những 
khoảng thời gian không liên tục trong một thủ tục. Y tướng cơ bản 
được minh họa tốt nhất bằng một thí dụ, như chương trình trong 
hình 8.10. 


n num ones zeros half res 


1 

runclion Mostỉyéero (n:ịnteger):booỉean ; 

c 







2 

var num, ones, zeros, half:mteger; 








3 

res:booíean; 








4 

begìh 








5 

num:=n*n 

4 

1 

< 






6 

ones:=0; 




c 

> 




7 

zero$:=Õ; 






<j 

Ị> 



8 

while num > 0 do 










9 

begin ~ “ - 










10 

half:=num div 2; 








c 



11 

if 2*half=num 











12 

then zeros:=zeros +1 











13 

else ones;=ones+1; 











14 

num:=hafí 








é 


15 

end; 









16 

it zèros>ones 



• 




17 

then res:=true 






Ọ 

18 

else res:=false; 






ir 

19 

MostỊyZero:=res 






ả 1 

20 

end; 








Hình 8,10 Chương trình thí dụ và trạng thái cũa các biến. Các vòng tròn 
trống thè hiện khi một biến đang sống và những vòng tròn đen thê hiện 

khi biến chết 

Phía trái hình 8.10 là một hàm Pascal 20-dòng c tùy ý ), hàm 
lấy tham sô' n y tính n 2 và sau đó đếm số bit 0 và số bit 1 ở dạng nhị 
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phân của n 2 . Nêu có nhiều bit 0 hơn bit 1, chương trình trả về giá 
trị true , ngược lại trả về giá trị faỉse. Các bit 0 ở vị trí cao ( nghĩa 
là các bit 0 ở phía tận cùng bên trái của n 2 ) không được đếm. 
Chương trình hoạt động bằng cách chia liên tiếp số đang kiếm tra 
cho 2 đê xem số là chẵn hay lẻ, cho biết giá trị của bit thấp. Việc 
kiểm tra chẵn lẻ được thực hiện trên dòng 10 và 11 ( nên nhớ ỉà 
nếu chia một số lé cho 2 rồi nhân thương số với 2 ta sẽ không có lại 
được số ban đầu, nhưng với một sỏ' chẵn thì ngược lại ). 

Hàm sự dụng 6 biến là n, num, ones, zeros, half và res. Biến đầu 
tiên n là một tham số; các biến còn lại là biến cục bộ. Tại mồi điểm 
trong thời gian thực thi hàm, mỗi biến ớ một trong 2 trạng thái. 

Một biến được gọi là sống ( live ) nếu giá trị mà biến chứa là 
cần thiết. Thí dụ nếu trình biên dịch phải tạo mã đê chứa dữ liệu 
sai ngẫu nhiên trong biến zeros trên dòng 12, hàm sẽ thất bại để 
hoạt động đúng, Tuy nhiên, sự nhầm lẫn giông như vậy của biến 
zeros trên dòng 5 sẽ không thành vấn đề bởi vì zeros sẽ được gán 
giá trị ngay. 

Một cách hình thức, biến V là biến sông ở điểm p nếu có một 
luồng điều khiển từ điểm nhập của thủ tục qua một phát biểu gán 
một giá trị cho V và sau đó qua p tới một phát biểu Ư khác, sứ 
dụng biến V nhưng không xen vào phép gán cho V giửa p và u. Thí 
dụ trong hình 8.11(a), ta thây rằng V sông giừa p và u bởi vì giá 
trị của V quan trọng. Mặt khác, trong hình 8.11(b), V không sông 
giừa p và Q bởi vì dù sao biến cũng sè nhận giá trị mới ở Q. Một 
biến không còn sông sẽ gọi là chết ( dead ). 

Khái niệm về sự sống quan trọng đối với sự phân phôi thanh 
ghi bởi vì hai hoặc nhiều biến có thể dùng cùng một thanh ghi nếu 
chúng không bao giờ cùng sông đồng thời. Trở lại hình 8.10 ta thấy 
các chu kỳ sông đôi với từng biến được đánh dấu ở 6 cột bên phải 
hình vẽ. Hãy chú ý n, haỉf và res là các biến sống trong nhừng 
phần hoàn toàn phân biệt của hàm. Một trình biên dịch tối ưu có 
thể tất cả 3 biến cho cùng một thanh ghi. Bởi vì n là tham sô" nhập, 
nên thanh ghi này sẽ ở trong các thanh ghi từ R8 tới RI5 ( xem 
hình 8.8 ), nhưng không có với việc sử dụng một thanh ghi nhập 
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cho các biến cục bộ một khi tham số nhập bị chết. Nêu có thanh ghi 
nhập chưa sứ dụng, dĩ nhiên chúng cũng được dùng cho các biến oục 
bộ. 


Procedure 
entry 

0 

p o V:=3 » 

l ỵ„_ 

> live 
here 

V Ổ X:=v * 

(a) 

Hình 8.11 Hai thí dụ về sự sông 

Procedure entry : điếm nhập cũa thu tục 
V live here : V sống ớ đây 

Một sô giải thuật được biêt đến làm tăng tôi đa việc gói các 
biến vào trong các thanh ghi ( Chaitin et al., 1981; Chow and 
Hennessy, 1984 ). Giải thuật phổ biến nhất được dùng gọi là tô màu 
đồ thị ( graph coloring ), trong đó mỗi thủ tục được biểu diễn như 
một đồ thị có hướng ( directed graph ) với các phát biểu là các nút 
và các đường điều khiển giữa các nút là các cung. Mỗi biến được ấn 
định một màu theo cách sao cho không có 2 biến nào đồng thời 
sống mà có cùng màu. Mục tiêu của giải thuật là tìm ra số màu tối 
thiếu cần cho đồ thị, gọi là số màu ( chromatic number ). Nếu số 
màu nhó hơn hoặc bằng với số thanh ghi, tất cả các biến được giữ 
trong thanh ghi và ta không cần các chỉ thị LOAD hoặc STORE. 

8.4 CUỘC TRANH LUẬN GIỮA MÁY RISC VÀ MÁY CISC 

Trong khi các máy RISC ngày càng có nhiều người ủng hộ, 
không phải là không có người chỉ trích chúng ( xem Colwell et ai., 
1985a, 1985b; Flymnn et al., 1987; Patterson và Hennessy, 1985 ). 


Procedure 

entry 

? 


p ộ V:=3 


Q ộ V:=4 


V Ỏ X:=v 
(b) 


V 

live 

here 
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Tiền đề cơ bản cùa phe ủng hộ máy RISC là các CPU được vi lập 
trình phức tạp là loại CPU đã chi phôi nền công nghiệp máy tính 
hàng thập kỷ nay đi vào chỗ bế tắc và sẽ bị bỏ đi, không có gì ngạc 
nhiên khi một số người gắn bó mật thiết với máy CISC hiểu rằng 
đó là sự kết thúc và xem xét chỉ trích công nghệ máy RISC và tìm 
ra những vấn đề mà những người đề xướng ra máy RISC muôn giâu 
đi. Trong phần này chúng ta sẽ khảo sát 4 vấn đề chính là trọng 
tâm của cuộc tranh luận giữa máy RISC và máy CISC, và trình bày 
các lập luận được đưa ra bởi cả 2 phía nhằm giúp người đọc có một 
phán quyết hiểu biết. 

Các chương trình viết bằng ngôn ngữ cấp cao chạy trên 
máy nào tốt hơn ? 

Không có người bình thường nào lập trình hoàn toàn bằng hợp 
ngữ nừa nên mọi người ai cũng muốn biết cấu trúc máy RISC có tốt 
hơn cấu trúc máy CISC không khi chúng chạy các chương trình viết 
bằng Ada, C, FORTRAN, Modula 2, Pascal và những ngôn ngử cấp 
cao khác. Câu hỏi tuy đơn giản nhưng câu trả lời lại không đơn 
giản chút nào. Hãy bắt đầu với “ tốt hơn ” có nghĩa là gì ?. 

Câu trả lời hiền nhiên sẽ là “ nhanh hơn Người ta có thê đơn 
giản chạy một tập các chương trình quan trọng viết bằng ngôn ngữ 
cấp cao trên máy RISC và CISC để xem máy nào chạy nhanh hơn. 
Đáng tiếc là sự đánh giá ( benchmarking ), như quá trình này được 
gọi, mở ra một sô' vân đề phức tạp ( Serlin, 1986 ). Vấn đề đầu tiên 
là các chương trình đánh giá ( ốenchmark program ) nên dược viết 
bằng ngôn ngừ nào ? Các chương trình FORTRAN có khuynh hướng 
có kích thước lớn và không có cấu trúc, với ít chỉ thị gọi thủ tục và 
nhiều chỉ thị GOTO. Vì các máy RISC chạy tốt với các chỉ thị gọi 
thủ tục nhưng không tôt với các chỉ thị nhảy nên một sự so sánh 
như vậy có công bằng cho máy RISC không ?. 

Vấn đề kế tiếp là các loại chương trình nào nên được kể đến 
trong các đánh giá ? Đại loại như các chương trình nhiều đệ qui như 
tháp Hà Nội và hàm Ackermann thực sự hoạt động rất nhanh trên 
máy RISC, nhưng chúng có đại diện cho các chi thị load làm việc 
thực tế không ?. 
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Còn về xuất/nhập thì sao ? Các máy RISC thực nghiệm tiêu biểu 
chỉ có xuất/nhập mới phôi thai ( thô sơ ), trong khi nhiều chương 
trình thực tế có sự hạn chế về xuất/nhập. Có hợp lý không nếu gạt 
bỏ vâh đề xuất/nhập ra khỏi sự so sánh ? 

Các chương trình có dá'u chấm động có dược kể đến không, và 
nếu có, chúng nên được cho mức ảnh hưởng bao nhiêu ? Không có 
sự giúp đỡ của phần cứng đặc biệt, máy RISC không thực hiện tốt 
các phép tính dấu châm động. Xét cho cùng, nhiều máy thậm chí 
không thể thực hiện nhán và chia sô' nguyên. Và dâ'u châm động có 
3 loại mức độ chính xác : đơn ( 32-bit ), kép ( 64-bit ) và mở rộng 
( 128-bit ). Nên sứ dụng độ chính xác nào ? 

Một yếu tô' quan trọng khác làm cho việc đánh giá trở nên phức 
tạp là yếu tố ảnh hướng của trình biên dịch. Nếu máy RISC thực 
hiện tốt hơn một máy VAX hoặc 80386, ai sẽ nói rằng câu trúc máy 
RISC tô't hơn ? Đơn giản là có thể có một trình biên dịch tôi ưu 
thực hiện một công việc lớn trẽn bài toán tô màu đồ thị hoặc tạo ra 
cách sử dụng các thanh ghi tốt hơn so với trình biên dịch của máy 
VAX hoặc 80386. 

Theo cách tương tự, các chương trình thực tế còn sử dụng các tài 
nguyên khác hơn là chỉ dùng CPU. Làm thế nào người ta có thể 
biết kết quả của việc chạy các chương trình kiểm tra phức tạp có 
phản á:ih những khác nhau về cấu trúc máy, hay những khác nhau 
về hiệu suất của hệ điều hành, kích thước trang hay giải thuật phân 
trang ? Giả sử máy RISC đánh bại máy VAX khi cả hai đều chạy 
UNIX, nhưng giả sứ sau dó máy VAX thực hiện tốt hơn máy RISC 
khi chạy VMS. Thực sự máy nào sè chạy nhanh hơn và hiệu suất là 
bao nhiêu tùy thuộc vào cấu trúc, chứ không phái tùy thuộc vào 
trình biên dịch khác nhau, các hệ điều hành và các chương trình 
kiểm tra đặc biệt được chọn. 

Điểm cuối cùng cỏ liên quan tới nhửng so sánh dã cóng bô' là 
ngạn ngữ cổ xưa : “ Figures don’t lie, but liars figure Nếu một 
người hoặc tô chức có mục đích cá nhân khi thực hiện nghiên cứu, 
người ta phải nhớ khả năng mà nhiều chương trình được đánh giá 
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và chỉ những chương trình thích hợp nhất mới được kể đến trong 
các kết quả đã công bố. 


Với tất cả điều đã nói, trong hình 8.12 ta biểu diễn một sô so 
sánh của máy Berkeyley RISC với các máy CISC phổ biến bằng 
một tập các đánh giá của UNIX được Deparment of Detense nghĩ ra 
nhằm so sánh các cấu trúc ( Patterson and Piepho, 1982 ). Trong 
lúc người ta có thể ngụy biện với nhiều vấn đề có liên quan tới việc 
đánh giá nói chung, dường như có thể an tâm mà nói rằng nếu có 2 
giáo sư và một lớp học gồm các sinh viên tốt nghiệp ớ Berkeyley có 
thê thiết kế và thực hiện một chip RISC, chip này thực hiện hơn 
một số bộ vi xử lý và máy tính mini đã dược các kỹ sư chuyên 
nghiệp thiết kế, ý tưởng về máy RISC không còn nghi ngờ có một 
số phẩm chât tốt. 
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Hình 8.12 So*sánh máy RISC I với 5 máy tính khác. Không có máy tính 

nào nhanh bằng nứa máy RISC I 

Relative períormance compared to RISC : hiệu suất tương đôi so sánh với 
RISC , • 

Với tất cả những khó khăn trong việc chạy các chương trinh 
hoạt động thực tế, một phương pháp thường được sứ dụng là tạo ra 
các chương trình đánh giá tống hợp có cùng sự pha trộn chí thị như 
là một mẫu đo dược của các chương trình thực tế. Các đánh giá 
nhân tạo này không thực hiện I/O, vì thế tất cả những gì chúng 
thực sự kiểm tra là trình biên dịch và hiệu suất của CPU. Vào 
những nám 1970, Curnow và Wichman ( 1975 ) của Phòng thí 
nghiệm Vật lý Quôc gia ở Anh đã phát triển một đánh giá tổng hợp 
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đế đo hiệu suất dấu châm động bằng sô" whetstone cho mỗi giây 
( một vvhetstone được định nghĩa là một chỉ thị dấu chấm động 
“ trung bình “ thõng kê ). 

Đơn vị tiếp sau whetstone theo tự nhiên gọi là dhrystone 
( Weicken, 1984 ) hiện đang được dùng rộng rãi đê so sánh máy 
RISC và may CISC. Không giông whetstone, dhrystone chỉ đo các 
phép tính sô' nguyên. Mặc dù các kết quả vẫn bị ảnh hưởng bởi các 
yêu tô như chất lượng của trình biên dịch, sự phân phôi thanh ghi, 
và hiệu suâ't của bộ nhớ cache, sô' dhrystone mồi giây mà một máy 
tính có thế thực hiện ít nhất cũng cho ta một phép đo hiệu suâ't. 

Hình 8.13 trình bày sỏ' dhrystone cùa vài máy RISC và máy 
CISC. Khi bôn chip RISC từ 4 người bán máy tính khác nhau đều 
thực hiện hơn mainírame 3090/200 hàng đầu cùa IBM, người ta khó 
có thể phu nhận rằng các máy RISC có tốc độ xử lý rất nhanh. 



Hình 8.13 Số dhrystone/sec cho các máy tính RISC và CISC. Đại thể xấp 
xỉ, 2000 dhrystone là 1 MIP ( một triệu chỉ thị trong 1 giây ) 

Có lẽ yếu tố khó khản nhất đế loại bó khi so sánh 2 máy là yếu 
tố về công nghệ sán xuất. Máy ECL RISC có nhanh hơn máy 
CMOS CISC không ? Hầu như chắc chắn là đúng như vậy vì các 
transistor ECL có tốc độ chuyển mạch nhanh hơn các transistor 
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CMOS nhiều. Máy RISC và máy CISC đang được so sánh luôn luôn 
dùng những loại bán dần khác nhau, các tốc độ xung clock khác 
nhau, các bus khác nhau và các chip nhớ khác nhau í chưa kể đến 
các bộ nhớ cache khác nhau, các đơn vị quán lý bộ nhớ khác nhau, 
sô' trạng thái chờ khác nhau và những kỹ thuật đường ông dẫn 
khác nhau ). Dưới những diều kiện này thật khó so sánh các cấu 
trúc độc lập với sự hiện thực. 

Một phép đo đôi khi được dùng là kích thước chương trình. Tuy 
nhiên, với giá thành bộ nhớ mỗi năm mỗi rẽ hơn, kích thước 
chương trình ngày càng tăng lên là điều không quan trọng, và 
ngoài ra cũng không có sự tương quan với tốc độ. Một ý tướng khác 
liên quan đến lưu lượng truy cập bộ nhớ, người ta có thế viết một 
trình mỏ phỏng cho một máy tính bất kỳ và sau đó dùng trình mô 
phỏng đê đếm sô' lần tham chiếu bộ nhớ, cho cá mã và dử liệu. Nếu 
2 máy tính được mô phỏng chạy cùng một chương trình đánh giá và 
một máy thực hiện chương trình đánh giá với 1.000.000 lần tham 
chiếu bộ nhớ, trong khi máy kia cũng thực hiện chương trình đánh 
giá đó chỉ cần 800.000 lần tham chiếu, tất cả mọi thứ đều như 
nhau, máy tính thứ 2 tốt hơn. 

Tuy nhiên, phép đo dường như độc lập với công nghệ này không 
hoàn toàn rõ ràng. 80386 và nhiều máy tính khác tìm nạp trước các 
chỉ thị trước khi chúng được cần đến. Mỗi lần có chỉ thị nhảy, nội 
dung của bộ đệm tìm nạp trước phải bị hủy. Các chu kỳ nhớ cần đè 
tìm nạp trước những chỉ thị bị húy này không xuất hiện trong hoạt 
động mô phòng, nhưng thường ta có thề cộng thêm 25 c ị vào việc 
nạp bus. 

Mặc dù các con sỏ' đả cho về hiệu suất có chiếu cô dên các máy 
RISC, nhưng công bằng mà nói cùng nên chỉ ra rằng các máy CISC 
đang được đánh giá là bị đè nặng bới việc tương thích với các máy 
cũ. Khi một nhóm chuyên gia ở IBM được yêu cầu xây dựng một 
máy tính xử lý nhanh nhất có thể được, nhừng nhà thiết kế đều bị 
kích thích do nhiệm vụ khó khăn này. Ngay sau đó, khi được yêu 
cầu chiếc máy phi thường này phải chạy được mọi chương trình của 
bất kỳ ai ở bất cứ nơi nào trên thế giới đã từng viết cho bất kỳ 
mainírame nào của IBM từ năm 1964, tinh thần của họ có giảm 
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xuống một chút. Cũng vậy, nếu 80486 không tương thích với mọi 
thứ kể từ 8088, các nhà thiết kế cùa Intel có thể đã xây dựng một 
máy rất khác. 

Từ triển vọng này, một trong những yếu tố chính về tôc độ của 
máy RISC là chúng hoàn toàn có những cấu trúc mới, tránh được 
những sai lầm trong quá khứ. Nếu nhóm thiết kế được yêu cầu thiết 
kế một máy CISC mới từ đầu một cách cụ thế’ với mục tiêu là chạy 
chương trình cùa c và Pascal, máy kết quả chắc chắn sẽ là một 
máy nào đó nhanh hơn nhiều so với bất kỳ một máy CISC nào 
hiện có. 

Có bao nhiêu lợi ích do có tập thanh ghi lớn ? 

Hết sức rỏ ràng là sơ đồ trùng lắp các cửa sổ thanh ghi có một 
đóng góp quan trọng vào hiệu suảt cũa các chip RISC I, RISC II và 
SPARC so với các sơ đồ khác. Mặt khác, chip MIPS tuy không sử 
dụng sự trùng lắp các cửa sổ nhưng cũng cho hiệu suất cao. Tuy 
nhiên vẫn rãt thú vị khi suy đoán rằng có bao nhiêu % hiệu suất 
được tạo ra do tập thanh ghi. 

Hitchcock và sprunt ( 1985 ) đả đi xa hơn nữa và đã viết các 
trình mô phóng cho RISC I, 68000 và VAX. Họ đã có 3 phiên bản 
cho mỗi trình mò phỏng, một cho sự trùng lắp các cửa sổ thanh ghi, 
một cho không có sự trùng lắp các cửa số thanh ghi và một cho tập 
thanh ghi. Sau đó họ đà chạy một tập các trình đánh giá chuẩn 
trên tất cá 9 máy bằng cách sửa đổi má hợp ngữ đã biên dịch để 
phù hợp với mỏ hình thanh ghi. Bằng cách này ảnh hưởng của tập 
thanh ghi có thế được phân biệt rõ từ tập chỉ thị ldn ( VAX ), trung 
bình ( 68000 ) hoặc nhỏ ( RISC I ). Thước đo hiệu suất sử dụng là 
khối lượng tổng cộng của lưu lượng bộ nhớ-CPƯ. 

Các kết quả có lẽ như là rất khả nghi. Máy VAX đà sửa đổi với 
sự trùng lắp các cửa sổ thanh ghi nhanh gấp 2 lần máy VAX bình 
thường, và 68000 với sự trùng lắp các cửa sổ nhanh gấp 4 lần. Mặt 
khác, việc loại bỏ sơ đồ cữa sổ ra khỏi RISC I làm tốc độ chip này 
giám đi 9 lần. Kết quả trái với trực giác duy nhất là trên các 
chương trinh có rất nhiếu đệ quy, việc trùng lắp các cửa sổ thực tế 

làm chậm tốc độ thực thi do không đù cửa sổ ( một cửa sổ tron ven 

■ * 
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phải được cất trên hầu hết mọi chỉ thị gọi và được khỏi phục lại 
trên mọi chỉ thị trở về ). Kết luận là sự trùng lắp cửa số thanh ghi 
là một ý tưởng hay, nhưng điều này ít nói về cấu trúc của RISC so 
với CISC. 

Đối với vân đề này, những người ling hộ máy RISC trả lời rằng 
cứa sổ thanh ghi lớn chỉ có thê do sự đơn gián cùa các chip RISC, 
và đặc biệt là do không có vi mã. Ngày nay tại bât. cứ thời điếm 
nào người ta đều có thể đặt n transistor lén một chip. Một số trong 
đó cần cho đơn vị điều khiển cơ bản, sỏ còn lại được dùng cho cóng 
việc khác. Chúng có thê dùng để chứa một vi chương trình lớn hoặc 
chứa một tập thanh ghi lớn, nhưng hai cách sứ dụng này rõ ràng 
đang thi đấu với cùng một sỏ transistor. 

Vì vậy câu trả lời đỏi với Hitchcock và sprunt là việc so sánh sự 
trùng lắp thanh ghi cùa VAX với sự trùng lắp thanh ghi cua máy 
RISC là không công bằng. Máy VAX chiêm nhiều vùng chip hơn 
máy RISC. Nói cách khác, nếu người thiết kê máy RISC được cung 
cấp một vung chip cần cho sự trùng lắp thanh ghi máy VAX, người 
này hoặc có thề gộp một tập thanh ghi lớn hơn nhiều, một bộ nhớ 
cache trên chip hoặc nhừng dặc tính khác dề cải tiên hiệu suât, 

Toàn bộ các máy RISC tôt như thê nào ? 

Các chương trình đánh giá ban đầu giới thiệu trong các tài liệu 
của RISC có khuynh hướng rất nhỏ. Thí dụ, chương trình kiểm tra 
dài nhất được Patterson và Piepho ghi lại ( 1982 ) chi chạy ti'ong 
thời gian không dầy 7 sec. Từ những dừ kiện này rõ ràng nếu trình 
ứng dụng của chúng ta luôn luôn bao gồm việc chạy các hàm đệ quy 
nhỏ suốt ngày như tháp Hà Nội, RISC là phương pháp nên làm. 
Nhưng nêu chúng ta muốn chạy các chương trình COBOL cũ có kích 
thước lớn thì sao ? Kết quả ít rõ ràng hơn. 

Các cố gắng ban đầu để chạy các chương trình Smalltalk và 
Lisp trên máy RISC I đang biến mất. Điều này đâ dẫn Patterson 
tới việc thiết kế các chip SOAR ( smalltalk on a RISC ) và SPƯR 
( symbolic Processing using RISC X ưngar et al., 1984 ). 
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Dù cho những chip này có nhiều thành công hơn, nhưng vấn đề 
nảy sinh cho công nghệ RISC là có phù hợp hay không với các máy 
tính mà chúng phải chạy nhiều trình ứng dụng và những ngôn ngừ 
đặc biệt rất khác với ngôn ngữ c. Một sô bằng chứng xuất phát từ 
Coutant et al. (1986). Họ báo cáo về việc xây dựng trình biên dịch 
COBOL cho máy RISC! Vì không có sô' thập phân hoặc những chỉ 
thị COBOL khác cho loại này, họ đã viết một thư viện các thủ tục 
để thực hiện những điều này, những điều mà một máy CISC thực 
hiện bình thường bằng vi mă. 

Hơn nữa, người ta có thề lấy những thuận lợi về thông tin của 
thời gian biên dịch đẻ làm tăng hiệu suất. Thí dụ khi di chuyển một 
chuỗi, trình biên dịch có thề gọi một thũ tục khi các trường nguồn 
và đích có cùng kích thước và một thủ tục khác nếu các trường này 
không cùng kích thước. Nhìn chung, hiệu suất đạt được thỏa các 
mục tiêu cua đề án. 

Ngoài các vấn đề về ngôn ngữ và hiệu suất chưa xử lý, nhừng 
yếu tô' khác cùng quan trọng đỏi với người bán máy tính và người 
sứ dụng. Các chip RISC đơn giàn hơn các chip CISC nhiều và dùng 
ít transistor hơn ( thậm chí tính luôn cả tập thanh ghi lớn ). Sự 
kiện này làm cho chúng dề dàng thiết kế hơn và ít có khả năng xảy 
ra trường hợp phái gọi lại do các lỗi vi mã. Điều đó cũng làm giảm 
thời gian giữa thiết kế và chuyền hàng, một vấn đề quyết định 
trong một nền công nghiệp biến đổi nhanh và cạnh tranh. 

Các thiết kế máy RISC dùng tương đối ít transistor, chúng rất 
phù hợp với các chip có tốc độ rất cao dựa trên GaAs ( Gallium 
Arsenide ) thay vì Silicon. Các chip tốc độ nhanh này có ít 
transistor hơn các chip silison nhiều nên thường không có đủ chỗ 
cho các vi chương trình phức tạp. 

Mặt khác, các máy CISC thích ứng tốt hơn với một họ máy có 
một dải rộng về giá cá và hiệu suât, như loạt máy 360. Những 
người bán máy tính thích ý tướng họ máy bởi vì ý tưởng này có thể 
cung cấp các máy tính cá nhán, máy tính mini và mainírame hoạt 
động trên cùng một cấu trúc. Các mô hình nhỏ hơn có thể được vi 
lập trình và nhận được các chức năng của chúng bằng phần mềm 
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trong lúc những mô hình lớn hơn có thề được nối cứng đế tăng tỏc 
độ- Các cấu trúc của máy RISC không thích ứng với khái niệm này. 

Viết trình biên dịch cho máy nào dễ hơn, máy RISC hay 
máy CISC ? 

Các trình biên dịch cho máy RISC rõ ràng có một số vấn đề mà 
các trình biên dịch thông thường không có. Quan trọng nhất trong 
số những vấn đề này là việc điều khiển các chỉ thị nạp, cất và nhảy 
bị trì hoãn. 

Khi trình biên dịch của máy có LOAD/STORE thấy một phát 
biểu gán như 

A := B 


phản ứng tự nhiên của trình này là tạo ra mã như 

LOAD B. RO ; nạp B vào thanh ghi RO 

STORE RO, A ; cất thanh ghi RO vào A 


Với một máy có chỉ thị nạp bị trì hoãn có liên khóa động 
( interlocked delayed load machine ), mã này sẽ làm việc được 
nhưng kém hiệu quả do khe trì hoãn tự động được phần cứng đưa 
vào, Với một máy không có liên khóa động, máy sè cho kết quả sai 
bởi vì thanh ghi chưa có giá trị đúng vào lúc chi thị STORE được 
thực thi. 

Tương tự, khi trình biên dịch phân tích cú pháp của phát biểu 
if, thông thường trình này tạo mã đế đánh giá điêu kiện và nhay 
tới phần else ( hoặc phát biêu kê tiẽp ) nêu diêu kiện sai. Phát biêu 


If A < B then MIN ;= A 
thường tạo ra mã như sau : 


LOAD A, RO 
LOAD B, RI 
CMP RO, RI 
JGE LI 


; nạp A vào thanh ghi RO 
; nạp B vào thanh ghi RI 
; so sánh A và B 
; nếu A >= B, nhảy tới nhãn LI 
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STORE RO, MIN 


LI : 


; cất A vào MIN 

; phát biểu kê tièp bắt đầu ở đây 


Đỗi với máy RISC có các chi thị nháy bị tri hoãn, mã này sai do 
phát biểu theo sau JGE sè được thực hiện dù cho thao tác nhảy có 
xảy ra hay không ? Bàng cách đặt chí thị NO-OP sau chỉ thị JGE ta 
hiệu chinh được mã nhưng kém hiệu quả. Trong thí dụ đơn giản này 
ta nên lưu ý 2 điều. Thứ nhât, có 5 chí thị, 3 trong sô đó bị trì 
hoãn. Thứ hai, không có nhiều cơ hội đế tổ chức lại mã hợp ngữ 
nhằm làm dầy bất kỳ khe trì hoãn nào. Mã phải được tìm thây từ 
lâu. 

Đối VỚI những thí dụ này, rõ ràng trình biên dịch của máy RISC 
phái cắt đứt công việc đê tạo mã, dó là cách làm đúng và khá hiệu 
quả. Không có vấn dề nào trong những vấn đề này xuất hiện trong 
máy CISC, do đó việc tạo mã sẽ dề dàng hơn. 

Hơn nữa, hầu như tất cả các trình biên dịch của máy RISC đều 
có các giái thuật phản phôi thanh ghi phức tạp như việc tô màu đồ 
thị đã đề cập trước đây. Trong khi những giải thuật này cải tiến mã 
bằng cách gom nhiều biến vào một số thanh ghi giới hạn, chúng 
cũng làm gia tăng lớn sự phức tạp cũa trình biên dịch. Việc sử dụng 
tôi đa hiệu suất của thanh ghi ít quan trọng hơn nhiều trong máy 
CISC bời vì sự bất lợi đôi với việc dùng bộ nhớ cũng ít hơn nhiều. 
Phép gán đơn gián một biến này cho một biến khác, như A := B, 
thường có thế được thực hiện tốt nhất chi bằng một chỉ thị MO VE 
di chuyến bộ nhớ - bộ nhớ, tránh được việc sử dụng tất cả các 
thanh ghi. 

Mặt khác, các cấu trúc máy RISC cũng có một đặc tính làm cho 
việc viết trình biên dịch dề dàng hơn. Trên hầu hết các máy RISC, 
thường chi có một phương pháp hợp lý để biên dịch một cấu trúc 
ngôn ngữ cấp cao bất kỳ. Các toán hạng phải được tìm nạp vào các 
thanh ghi, thực hiện tính toán và đưa kết quả trả về vào bộ nhớ. 
Máy CISC có quá nhiều chọn lựa. Xét thí dụ : 


A := B + c 
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Một cách để biên dịch phép gán này cho một máy CISC có các 
chỉ thị thanh ghi-thanh ghi, thanh ghi-bộ nhớ và bộ nhớ-bộ nhớ 
( như PDP-11 hoặc VAX ) là : 


MOV B, RO 
ADD c, RO 
MOV RO, A 


; nạp B vào thanh ghi RO 
; RO bây giờ bằng với B 
; cất B + c vào A 


Chuỗi mã này cần 3 chỉ thị được tìm nạp từ bộ nhớ và 3 lần 
tham chiếu bộ nhớ cho dữ liệu, mỗi lần cho một chỉ thị. Tuy nhiên, 
có một chuỗi mã khác là : 


; chép B vào A 

; cộng c với A đê hình thành B + C 


MOV B, A 
ADD c, A 


Bây giờ ta thực hiện tính toán chỉ với 2 chỉ thị. Với chi phí 
phiên dịch cao trên một máy tính có vi lập trình, việc bỏ đi được 
một chỉ thị là điều nên làm. 

Tuy nhiên, chi phí phiên dịch không phải chỉ có một giá duy 
nhất. Hiệu suất tổng thề tùy thuộc một phần vào cách chỉ thị ADD 
làm việc với bộ nhớ như thê nào. Nếu trước tiên chỉ thị này tìm 
nạp A và c vào CPU, cộng chúng lại và sau đó cât kêt quả vào bộ 
nhớ, chuỗi mã này cần 2 lần tìm nạp chỉ thị và 5 lần tham chiêu bộ 
nhớ cho dữ liệu. Ngược lại, nếu có mặt của bộ nhớ cache, chi có lần 
tham chiếu thứ nhất tới A thực sự được tính đến; những lần tham 
chiếu khác được đáp ứng bởi bộ nhớ cache và không cần tính đến. 

Bởi vì các máy CISC có nhiều phương pháp thực hiện cùng một 
phép tính, trình biên dịch phải dành nhiều nỗ lực đê phân tích 
chúng. Trong trường hợp xấu nhất, thậm chí giải thuật có thể là sự 
hiện thực phụ thuộc. Thí dụ, thật không thể tin dược, trên một họ 
máy CISC một chuỗi 3 chỉ thị tốt hơn trên những máy tốc độ thấp 
không có bộ nhcỹ cache, nhưng chuỗi 2 chỉ thị lại tốt hơn trên 
những máy tốc độ cao có bộ nhớ cache. 

Với thí dụ cuôì cùng, ta hãy xem điều gì sẽ xảy ra nếu biến c 
trong phát biểu gán ban đầu được thay bằng hằng số. Phép phân 
tích sẽ hoàn toàn khác bởi vì bây giờ các chỉ thị kiểu tức thời có 
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thể áp dụng được. Hơn nữa, nêu hằng số là —1 hoặc +1, tôt nhât 
nên dùng các chỉ thị INCREMENT và DECREMENT. Trình biên 
dịch phải xử lý tất cả những khả năng này nêu như cần phải tạo 
mã tốt nhất trong mọi trường hợp. 

Các máy RISC không có sự phức tạp này. Cách duy nhất để 
thực hiện phép tính là tìm nạp các toánJiạng vào các thanh ghi, 
thực hiện tính toán ở đó và lưu kết 'quả. 

8.5 TÓM TẮT 

Trong chương này ta đã khảo sát chi tiêt 1 trong 2 loại câu trúc 
tiên tiến : máy tính RISC. Máy RISC được thiết kê cho hiệu suất 
cao. Máy này đạt được tốc độ cao bằng cách loại trừ vi mã và thực 
thi những chỉ thị dơn giản rất nhanh. 

Bản chất của máy RISC là thực thi một chỉ thị với một chu kỳ 
đường dữ liệu, trực tiếp trên phần cứng, không có sự phiên dịch nào 
được thực hiện bởi sự có mặt của một cấp phần mềm. Những chỉ thị 
cơ bản là các thao tác thanh ghi-thanh ghi đơn giản, như ADD và 
AND, chúng không thực hiện một tham chiếu bộ nhớ nào. Tập chỉ 
thị luôn luôn được chọn sao cho các chỉ thị được thực thi dơn giản 
và nhanh chóng. Máy RISC có ít dạng chỉ thị và càng ít kiểu định 
địa chỉ hơn so vứi máy CISC. 
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Linux - Tập 2: Word trong Limix - T4p 3: Excel trong 
Linux 

182. Dò họa và mulũmedia trong vin phòng vđi MS 
PowerPoínt 2000 

183 Giáo trinh lý thuyết và thực hảnh tin học vần phòng 
* Tập 1: Wmdowa XP (tứ sách dề hoc) 

184, Giấo trình lỷ thuyết và thực hảnh tin hpc vần phồng 
‘ TỄp 2: Word XP ỉ tù sểch dè học) 

185 Gido trinh iỷ thuyết vè thực hầrìh tín hoc vin phbn| 

■ Táp 3: Excel xp - Quyền ĩ 4 2 (tủ sách dế hoc) 

186 Gido trinh lý thuyèt vả hành tin học vần phòng 
' T *p 4 PowerPoint XP - Quyển 1 * 2 (tú sểch dế 
học) 

187 Cido trình tin học phỏ thõng ICDL * hoe phdn 14 2 

THỂ LOẠI KHẤC 

188 Hệ thông hiì táp kế toán tải chính - Tập 1 
189, Hệ thống bái tồp kế toán dại cương 

190 Tử điến từ mdi Tiếng Việt 

19L Từ díển Tiếng Việt phố thdng 

192. Từ diến Anh - Vi^t (Ấn bén sinh viên) 

193 Tử điển thảnh ngữ - Tục ngừ - Ca dao Việt Nam 
(Quyến Thương Quyến Hậl 
194. Giáo trình tữẩĩị già ì tích 1 

196. Toển tổ hợp 

196 Phiamg pháp tndí hoc toán dại hoe 

197. Nghi Uuk thương mai quâc té 

198. Giáo trinh thư tín trong thương mại qtdic tế (Texbookỉ 
199 SẢ tay ngdờì d|ch tiếng Anh 
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GIÁO TRÌNH 


Cấu trúc 
Máy tính 

Nội dung cuốn sách này trình bày về tổ chức 
của máy tính theo quan điểm chia máy tính 
thành nhiều cấp. Chủng ta xem xét một cách chi 
tiết 5 cấp máy: cấp ỉogic số, cấp vi lập trình, cấp 
máy qui ước, cấp hệ điều hành và cấp hợp ngữ. 
Cấp ngôn ngữ cấp cao và trên nữa không thuộc 
phạm vi của quyển sách này. Các vấn đề cơ bần 
sau đây được để cập đến : 

1./ Thiết kế tổng thể từng cấp và lý do 
tại sao phải thiết kế như vậy. 

2J Các loại chỉ thị có giá trị. 

3. / Các loại dữ liệu được sử dụng. 

4. / Các cơ chế thay đổi từng dòng 

điều khiển. 

5. / Tổ chức bộ nhớ và định địa chỉ. 

6. / Mối quan hệ giữa tập chỉ thị và tổ chức 

bộ nhớ. 

7 J Các 'phương pháp hiện thực từng cấp. 


mm. 
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